GroupDocs.Parser for .NET

C#를 사용한 XML 하이퍼링크 추출

GroupDocs.Parser를 사용하여 PDF, Word, Excel 및 기타 문서 유형에서 URL과 하이퍼링크를 감지하고 추출하세요.

C#에서 Xml에서 하이퍼링크를 추출하는 단계

GroupDocs.Parser는 .NET 개발자가 다음 간단한 단계를 따르세요: XML 파일에서 하이퍼링크를 추출할 수 있습니다.

  1. Parser 인스턴스를 사용하여 XML 파일을 로드합니다.
  2. 문서가 하이퍼링크 추출을 지원하는지 확인합니다.
  3. 문서에서 하이퍼링크 목록을 검색합니다.
  4. 결과를 루프하여 추출된 URL을 사용합니다.
// 하이퍼링크가 포함된 문서를 Parser 클래스를 사용하여 로드합니다.
using (Parser parser = new Parser("input.xml")) {

    // 파일이 하이퍼링크 추출을 지원하는지 확인합니다.
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("해당 파일에서는 하이퍼링크 추출을 사용할 수 없습니다.");
        return;
    }

    // 추출된 하이퍼링크를 검색하고 처리합니다.
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
클릭하여 복사
복사되었습니다
더 많은 예시 문서화

고급 문서 파싱 기능

하이퍼링크 추출 외에도 GroupDocs.Parser는 텍스트, 메타데이터, 이미지 및 구조화된 데이터를 추출할 수 있으며, 강력한 데이터 처리 작업 흐름을 지원합니다.

하이퍼링크 감지 및 문서 파싱

문서에서 하이퍼링크 감지

PDF, Word 파일, 스프레드시트 등에서 URL과 링크 주석을 신속하게 추출합니다.

웹 및 삽입 링크 지원

다양한 형식에서 표준 웹 URL 및 삽입 문서 링크를 감지하고 추출합니다.

유연한 파싱 옵션

성능과 정확성을 향상시키기 위해 특정 섹션이나 페이지를 스캔할 수 있도록 추출 설정을 사용자 정의합니다.

링크 옵션을 사용하여 PDF에서 하이퍼링크 추출하는 방법

이 코드 예제에서는 사용자 지정 옵션을 사용하여 PDF 파일에서 모든 하이퍼링크를 추출하는 방법을 보여줍니다.

C#

//  PDF 문서로 Parser를 초기화합니다.
using (Parser parser = new Parser("input.docx"))
{
    // 하이퍼링크 추출이 지원되는지 확인합니다.
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // 결과를 좁히기 위해 링크 추출 옵션을 설정합니다.
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // 문서에서 하이퍼링크 데이터를 추출합니다.
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // 추출된 링크 목록을 처리합니다.
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

GroupDocs.Parser for .NET API에 대하여

GroupDocs.Parser는 .NET 개발자를 위한 다용도 문서 파싱 API입니다. PDF, Word, Excel, HTML 등의 다양한 파일 형식에서 하이퍼링크, 텍스트, 이미지 및 구조화된 내용을 추출하는 기능을 제공하며, 외부 소프트웨어에 의존하지 않습니다.
더 알아보기
About illustration

시작할 준비가 되셨나요?

GroupDocs.Parser를 무료로 다운로드하거나 전체 액세스를 위한 평가판 라이센스를 받으세요!

유용한 리소스

경험을 향상시키기 위해 문서, 코드 샘플 및 커뮤니티 지원을 탐색하십시오.

하이퍼링크 추출 지원 형식

GroupDocs.Parser는 다양한 문서 유형에서 하이퍼링크를 추출할 수 있습니다. 일반적으로 지원되는 형식은 아래를 참조하세요.

임시 라이센스 팁

1
직장 이메일로 가입하세요. 무료 메일 서비스는 허용되지 않습니다.
2
두 번째 단계에서 임시 라이센스 받기 버튼을 사용하세요.
 한국인