GroupDocs.Parser는 .NET 개발자가 다음 간단한 단계를 따르세요: XLSX 파일에서 하이퍼링크를 추출할 수 있습니다.
- Parser 인스턴스를 사용하여 XLSX 파일을 로드합니다.
- 문서가 하이퍼링크 추출을 지원하는지 확인합니다.
- 문서에서 하이퍼링크 목록을 검색합니다.
- 결과를 루프하여 추출된 URL을 사용합니다.
GroupDocs.Parser는 .NET 개발자가 다음 간단한 단계를 따르세요: XLSX 파일에서 하이퍼링크를 추출할 수 있습니다.
// 하이퍼링크가 포함된 문서를 Parser 클래스를 사용하여 로드합니다.
using (Parser parser = new Parser("input.xlsx")) {
// 파일이 하이퍼링크 추출을 지원하는지 확인합니다.
if (!parser.Features.Hyperlinks)
{
Console.WriteLine("해당 파일에서는 하이퍼링크 추출을 사용할 수 없습니다.");
return;
}
// 추출된 하이퍼링크를 검색하고 처리합니다.
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
foreach (PageHyperlinkArea h in hyperlinks)
{
Console.WriteLine(h.Text);
Console.WriteLine(h.Url);
}
}
하이퍼링크 추출 외에도 GroupDocs.Parser는 텍스트, 메타데이터, 이미지 및 구조화된 데이터를 추출할 수 있으며, 강력한 데이터 처리 작업 흐름을 지원합니다.
PDF, Word 파일, 스프레드시트 등에서 URL과 링크 주석을 신속하게 추출합니다.
다양한 형식에서 표준 웹 URL 및 삽입 문서 링크를 감지하고 추출합니다.
성능과 정확성을 향상시키기 위해 특정 섹션이나 페이지를 스캔할 수 있도록 추출 설정을 사용자 정의합니다.
이 코드 예제에서는 사용자 지정 옵션을 사용하여 PDF 파일에서 모든 하이퍼링크를 추출하는 방법을 보여줍니다.
// PDF 문서로 Parser를 초기화합니다.
using (Parser parser = new Parser("input.docx"))
{
// 하이퍼링크 추출이 지원되는지 확인합니다.
if (!parser.Features.Hyperlinks)
{
return;
}
// 결과를 좁히기 위해 링크 추출 옵션을 설정합니다.
PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));
// 문서에서 하이퍼링크 데이터를 추출합니다.
IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);
// 추출된 링크 목록을 처리합니다.
foreach (PageHyperlinkArea h in hyperlinks)
{
Console.WriteLine(h.Text);
Console.WriteLine(h.Url);
}
}