Parser 용 Net

.NET용 Document Parser SDK

.NET 앱에 빠르고 정확한 문서 파싱을 추가하고 문서와 이미지에서 텍스트, 이미지, 메타데이터 및 구조화된 데이터를 추출합니다.

NuGet 다운로드 무료 평가판 시작

버전 24.9 출시

새로운 기능 보기

// 소스 파일을 Parser 인스턴스에 전달합니다
using (var parser = new Parser("source.pdf"))
{
    // 문서 텍스트를 TextReader에 전달합니다
    using (var textReader = parser.GetText())
    {
        // 문서 텍스트를 처리합니다
        Console.WriteLine(textReader?.ReadToEnd());
    }
}

dotnet add package GroupDocs.Parser

GroupDocs.Parser 한눈에 보기

.NET 애플리케이션에서 고정밀 문서 파싱을 수행하기 위한 Document Parser SDK

문서에서 데이터 추출

GroupDocs.Parser for .NET API를 사용하면 Office 문서, 이메일, 첨부 파일 및 아카이브와 같은 다양한 파일 형식에서 텍스트, 메타데이터 및 이미지를 검색할 수 있습니다. 이 강력한 도구는 데이터 분석, 검색 엔진 인덱싱 또는 콘텐츠 관리 시스템 등 다양한 애플리케이션에서 이러한 파일에 포함된 유용한 정보를 효율적으로 액세스하고 처리하는 데 도움이 됩니다.

문서 파싱

PDF 양식에서 하이퍼링크, 표, QR 코드, 바코드 및 데이터를 비롯한 다양한 요소를 추출합니다. 또한 맞춤 템플릿을 사용해 문서에서 원하는 정보를 파싱할 수 있습니다.

결과 맞춤 설정

.NET API를 사용하면 원시, 구조화, HTML 또는 Markdown과 같은 다양한 형식으로 데이터를 검색할 수 있습니다. 또한 API는 문서 텍스트 내에서 특정 단어나 구절을 찾는 검색 기능을 제공합니다.

플랫폼 독립성

GroupDocs.Parser for .NET은(는) 다음 운영 체제, 프레임워크 및 패키지 관리자를 지원합니다.

지원되는 파일 형식

GroupDocs.Parser for .NET은(는) 다음 파일 형식에 대한 작업을 지원합니다.

Microsoft Office 형식

Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

이미지 및 기타 형식

휴대용: PDF
이미지: JPG, BMP, PNG, TIFF, GIF
기타 오피스 형식: ODT, OTT, OTS, ODS, ODP, OTP, ODG

기타 형식

웹: HTML, MHTML
아카이브: ZIP, TAR, 7Z
전자책: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET 기능

당사의 .NET Document Parser SDK를 사용해 PDF, Office 문서, 이미지 및 기타 형식에서 데이터를 빠르고 정확하게 추출합니다.

텍스트 추출

Office 문서, PDF 파일 및 이미지와 같은 다양한 파일 형식에서 텍스트 정보를 추출해 가독성과 분석을 용이하게 합니다.

이미지 추출

Office 문서, PDF 파일 등 다양한 소스에서 시각적 콘텐츠를 검색해 편리하게 액세스하고 사용할 수 있습니다.

QR 코드 스캔

Office 문서, PDF 파일 또는 시각적 콘텐츠에 포함된 QR 코드를 감지하고 디코딩해 효율적인 정보 검색을 지원합니다.

이메일 첨부 파일 및 아카이브에서 데이터 추출

이메일 메시지, 파일 첨부 및 압축 데이터 소스에서 귀중한 정보를 수집하여 효과적인 분석 및 활용을 수행합니다.

테이블 추출

PDF 문서에서 표 형식 데이터를 식별하고 추출하여 체계적인 분석 및 활용에 사용할 수 있습니다.

하이퍼링크 추출

오피스 문서나 PDF 파일 내의 하이퍼링크 및 이메일 주소를 찾아 추출하여 효율적인 액세스를 가능하게 합니다.

PDF 양식 파싱

PDF 양식은 사용자가 전자적으로 정보를 입력할 수 있는 입력 가능한 필드를 포함한 디지털 문서입니다. .NET API를 사용하여 이러한 양식에서 데이터를 추출하고 효율적으로 처리할 수 있습니다.

템플릿으로 데이터 파싱

사용자 정의 템플릿을 생성하고 이를 .NET API와 함께 사용하여 PDF 파일에서 특정 정보를 파싱함으로써 데이터 추출 프로세스를 간소화합니다.

문서 내 텍스트 검색

문서 내에서 특정 단어나 패턴을 신속하게 찾습니다.

코드 샘플

일반적인 GroupDocs.Parser for .NET 작업의 일부 사용 사례

PDF 문서에서 이미지 추출

GroupDocs.Parser for .NET은(는) C#

개발자가 문서에서 이미지를 쉽게 추출하도록 지원합니다.

C#에서 PDF 문서에서 이미지 추출

// Parser 클래스의 인스턴스를 생성합니다. style=color:#00f>using (var parser = new Parser("source.pptx")) { // 이미지 추출 var images = parser.GetImages(); // 무언가가 추출되었는지 확인합니다 if (images == null) { return; } // 이미지를 반복 처리합니다 foreach (PageImageArea image in images) { // 페이지 인덱스, 사각형 및 이미지 유형을 출력합니다 Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); } }

`이미지에서 바코드 추출`

우리 .NET API를 사용하여 이미지에서 바코드를 추출합니다:

`C#에서 이미지에서 바코드 추출`

// Parser에 소스 이미지를 로드합니다
using (var parser = new Parser("source.jpg"))
{
    // 파일이 바코드 추출을 지원하는지 확인합니다
    if (parser.Features.Barcodes)
    {
        // 파일에서 바코드 추출
        var barcodes = parser.GetBarcodes();

        // 바코드를 반복 처리합니다
        foreach (var barcode in barcodes)
        {
            // 페이지 인덱스를 출력합니다
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // 바코드 값을 출력합니다
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

`시작할 준비가 되셨나요?`

GroupDocs.Parser를 무료로 다운로드하거나 전체 액세스를 위한 평가판 라이센스를 받으세요!

NuGet 다운로드
무료 평가판 시작

`유용한 리소스`

경험을 향상시키기 위해 문서, 코드 샘플 및 커뮤니티 지원을 탐색하십시오.


선적 서류 비치
API 참조
코드 샘플
무료 지원
유료 지원