C#.NET API를 통해 Excel, Word, PDF 및 PowerPoint 문서에서 테이블 추출

GroupDocs.Parser .NET API를 통해 프로그래머는 PDF, DOC, DOCX, PPT, PPTX, EML, MSG, XLS, XLSX, CSV에서 테이블을 추출할 수 있습니다. , ODT, RTF & EPUB 문서 또는 페이지.


무료 평가판 다운로드

.NET API를 통해 XHTML 파일에서 테이블을 추출하는 방법은 무엇입니까?

표는 행과 열로 배열된 셀 모음입니다. 테이블은 상세하거나 복잡한 데이터를 사용자가 쉽게 읽고 볼 수 있도록 저장하고 정리하는 데 매우 중요한 역할을 합니다. 표는 목록 만들기, 정보 비교, 데이터 정렬, 정보 그룹화, 데이터의 추세 또는 패턴 강조 등 다양한 방법으로 사용할 수 있습니다. GroupDocs.Parser for .NET는 소프트웨어 프로그래머가 PDF, 이메일, 전자책, Word(DOC, { 318}), PowerPoint (PPT, PPTX), Excel (XLS, XLSX), 이메일(EML, MSG) 형식 등. .NET API에는 문서에서 모든 테이블 추출, 특정 페이지에서 테이블 추출, 테이블 셀 데이터 가져오기, 테이블 행 및 열의 총 수 가져오기, 행 높이 가져오기, 테이블의 데이터를 인쇄하고 그 이상일 수 있습니다.

.NET의 XHTML에서 테이블 추출

GroupDocs.Parser for .NET를 사용하면 C# 개발자가 몇 가지 간단한 단계를 구현하여 XHTML 파일에서 테이블을 쉽게 추출할 수 있습니다.

C# 예제 코드를 사용하여 XHTML 파일에서 테이블을 추출하는 방법

// GroupDocs.Parser API를 사용하여 XHTML 파일에서 테이블 추출
// Parser 클래스의 인스턴스 생성
using (Parser parser = new Parser(filePath)) {
    // 문서가 테이블 추출을 지원하는지 확인
    if (!parser.Features.Tables) {
        Console.WriteLine("문서는 테이블 추출을 지원하지 않습니다.");
        return;
    }
    // 테이블 레이아웃 만들기
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });
    // 테이블 추출 옵션 만들기
    PageTableAreaOptions options = new PageTableAreaOptions(layout);
    // 문서에서 테이블을 추출합니다.
    IEnumerable<PageTableArea> tables = parser.GetTables(options);
    // 테이블 반복
    foreach (PageTableArea t in tables) {
        // 행 반복
        for (int row = 0; row < t.RowCount; row++) {
            // 열을 반복
            for (int column = 0; column < t.ColumnCount; column++) {
                // 테이블 셀 가져오기
                PageTableAreaCell cell = t[row, column];
                if (cell != null) {
                    // 테이블 셀 텍스트 인쇄
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
            Console.WriteLine();
        }
        Console.WriteLine();
    }
}

시스템 요구 사항

GroupDocs.Parser for .NET API는 모든 주요 플랫폼 및 운영 체제에서 지원됩니다. 아래 코드를 실행하기 전에 시스템에 다음 필수 구성 요소가 설치되어 있는지 확인하십시오.

  • 운영 체제: Microsoft Windows, Linux, MacOS
  • 개발 환경: Microsoft Visual Studio, Xamarin, MonoDevelop
  • 프레임워크
  • Nuget에서 GroupDocs.Parser for .NET의 최신 버전을 다운로드하세요.

GroupDocs.Parser for .NET를 사용하는 이유

  • 지원되는 모든 문서에서 일반 텍스트 추출 지원
  • 사용자 정의 템플릿을 통한 문서 분석
  • 구조화된 텍스트 추출을 완벽하게 지원
  • 키워드 및 정규 표현식을 통한 텍스트 검색
  • 형식이 지정된 텍스트, 메타데이터, 이미지, 컨테이너 및 첨부 파일 추출
  • 지원되는 일부 문서 형식의 목차 추출
  • PDF 문서에서 양식 데이터 구문 분석
  • 문서에서 하이퍼링크 추출

다른 문서 형식에서 테이블 추출

.NET 파일 형식 및 이미지에 대한 문서 구문 분석 및 테이블 스캐닝 API. 아래에 설명된 대로 널리 사용되는 일부 파일 형식에 대한 데이터를 추출합니다.

Back to top
 한국인