GroupDocs.Parser for .NET

C#를 사용한 XML의 테이블 추출

GroupDocs.Parser을 사용하여 PDF, Word, Excel 및 기타 파일 형식에서 테이블 구조를 신속하게 식별하고 추출하십시오. .NET 프로젝트에서 가능합니다.

NuGet 다운로드

무료 평가판 시작

C#에서 Xml의 테이블을 추출하는 단계

GroupDocs.Parser를 사용하여 .NET 환경 내에서 XML 파일에서 테이블을 추출하기 위한 지침을 따라 주십시오:

Parser 인스턴스를 초기화하고 XML 문서를 로드합니다.
입력 형식에 대한 테이블 추출 지원 여부를 확인합니다.
파일에서 테이블 내용을 추출합니다.
보고서 작성, 자동화 또는 분석을 위해 구조화된 테이블 데이터를 사용합니다.

복사

// Parser를 사용하여 테이블 데이터가 포함된 문서를 엽니다.
using (Parser parser = new Parser("input.xml")) {

    // 해당 형식이 테이블 인식을 지원하는지 확인합니다.
    if (!parser.Features.Tables) {
        Console.WriteLine("테이블 파싱을 지원하지 않는 문서를 처리합니다.");
        return;
    }

    // 테이블 구조가 어떻게 인식되어야 하는지 정의합니다.
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // 테이블 데이터에 대한 추출 매개변수를 지정합니다.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  파일 내용에서 테이블을 추출합니다.
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  감지된 각 테이블을 반복합니다.
    foreach (PageTableArea t in tables)
    {
    }
}

dotnet add package GroupDocs.Parser

클릭하여 복사

복사되었습니다

더 많은 예시 문서화

강력한 데이터 추출 기능

테이블 파싱 외에도 GroupDocs.Parser은 문서 자동화를 위한 텍스트 블록, 이미지, 메타데이터 및 기타 구조화된 데이터를 추출할 수 있습니다.

정확한 다중 형식 테이블 감지

DOCX, XLSX, PDF, HTML 및 유사한 형식에서 높은 정밀도로 표 형식 데이터를 추출합니다.

파일에서 테이블 구조 파싱

형식 손실 없이 문서 및 스프레드시트에서 테이블 데이터를 효율적으로 검색합니다.

유연한 테이블 추출 구성

출력을 위한 레이아웃 감지, 열 정렬, 머리말/바닥글 옵션을 조정하여 정확한 제어를 제공합니다.

Excel 스프레드시트에서 테이블 추출하는 방법

이 코드 샘플은 GroupDocs.Parser을

사용하여 XLSX 파일에서 테이블 데이터를 읽고 반복하는 방법을 보여줍니다.

C#

//  Parser API를 사용하여 Excel 파일을 엽니다. style=color:#00f>using (Parser parser = new Parser("input.xlsx")) { // 파일에서 테이블을 추출할 수 없으면 종료합니다. if (!parser.Features.Tables) { return; } // 레이아웃 규칙을 사용하여 표 형식 콘텐츠의 위치를 찾습니다. TemplateTableLayout layout = new TemplateTableLayout( new double[] { 50, 95, 275, 415, 485, 545 }, new double[] { 325, 340, 365, 395 }); // 테이블에 대한 추출 매개변수를 설정합니다. PageTableAreaOptions options = new PageTableAreaOptions(layout); // 테이블 추출 작업을 수행합니다. IEnumerable<PageTableArea> tables = parser.GetTables(options); // 감지된 각 테이블 구조를 살펴봅니다. foreach (PageTableArea t in tables) { // 테이블의 각 행을 반복합니다. for (int row = 0; row < t.RowCount; row++) { // 각 행의 셀을 반복합니다. for (int column = 0; column < t.ColumnCount; column++) { // 현재 테이블 셀에 액세스합니다. PageTableAreaCell cell = t[row, column]; if (cell != null) { // 각 셀의 텍스트 내용을 표시합니다. Console.Write(cell.Text); Console.Write(" | "); } } } } }

`GroupDocs.Parser for .NET API 소개`

GroupDocs.Parser는 .NET 개발자를 위해 구축된 포괄적인 문서 파싱 API입니다. PDF, DOCX, XLSX, PPTX 등과 같은 다양한 형식에서 텍스트, 테이블, 이미지, 하이퍼링크 및 기타 구조화된 요소를 정확하게 추출할 수 있으며, 제3자 소프트웨어가 필요하지 않습니다.

더 알아보기

`시작할 준비가 되셨나요?`

GroupDocs.Parser를 무료로 다운로드하거나 전체 액세스를 위한 평가판 라이센스를 받으세요!

NuGet 다운로드
무료 평가판 시작

`유용한 리소스`

경험을 향상시키기 위해 문서, 코드 샘플 및 커뮤니티 지원을 탐색하십시오.


선적 서류 비치
API 참조
코드 샘플
무료 지원
유료 지원

`테이블 추출을 위한 지원 형식`

GroupDocs.Parser은 다양한 문서 유형에서 테이블 데이터를 추출할 수 있습니다. 아래는 구조화된 테이블 파싱에 주로 사용되는 형식입니다.

PDF 파싱(휴대 문서 형식)
DOCX 파싱(Office 2007+ 워드 문서)
PPTX 파싱(Open XML 프레젠테이션 형식)
XLSX 파싱(Open XML 워크북)
TXT 파싱(텍스트 파일)
RTF 파싱(리치 텍스트 형식)
EPUB 파싱(오픈 전자책 파일)

C#를 사용한 XML의 테이블 추출

C#에서 Xml의 테이블을 추출하는 단계

강력한 데이터 추출 기능

정확한 다중 형식 테이블 감지

파일에서 테이블 구조 파싱

유연한 테이블 추출 구성

Excel 스프레드시트에서 테이블 추출하는 방법

C#

GroupDocs.Parser for .NET API 소개

시작할 준비가 되셨나요?

유용한 리소스

테이블 추출을 위한 지원 형식

임시 라이센스 팁

`GroupDocs.Parser for .NET API 소개`

`시작할 준비가 되셨나요?`

`유용한 리소스`

`테이블 추출을 위한 지원 형식`

`임시 라이센스 팁`