표는 행과 열로 배열된 셀 모음입니다. 테이블은 상세하거나 복잡한 데이터를 사용자가 쉽게 읽고 볼 수 있도록 저장하고 정리하는 데 매우 중요한 역할을 합니다. 표는 목록 만들기, 정보 비교, 데이터 정렬, 정보 그룹화, 데이터의 추세 또는 패턴 강조 등 다양한 방법으로 사용할 수 있습니다. GroupDocs.Parser for .NET는 소프트웨어 프로그래머가 PDF, 이메일, 전자책, Word(DOC, { 318}), PowerPoint (PPT, PPTX), Excel (XLS, XLSX), 이메일(EML, MSG) 형식 등. .NET API에는 문서에서 모든 테이블 추출, 특정 페이지에서 테이블 추출, 테이블 셀 데이터 가져오기, 테이블 행 및 열의 총 수 가져오기, 행 높이 가져오기, 테이블의 데이터를 인쇄하고 그 이상일 수 있습니다.
GroupDocs.Parser for .NET를 사용하면 C# 개발자가 몇 가지 간단한 단계를 구현하여 XHTML 파일에서 테이블을 쉽게 추출할 수 있습니다.
// GroupDocs.Parser API를 사용하여 XHTML 파일에서 테이블 추출
// Parser 클래스의 인스턴스 생성
using (Parser parser = new Parser(filePath)) {
// 문서가 테이블 추출을 지원하는지 확인
if (!parser.Features.Tables) {
Console.WriteLine("문서는 테이블 추출을 지원하지 않습니다.");
return;
}
// 테이블 레이아웃 만들기
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// 테이블 추출 옵션 만들기
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// 문서에서 테이블을 추출합니다.
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// 테이블 반복
foreach (PageTableArea t in tables) {
// 행 반복
for (int row = 0; row < t.RowCount; row++) {
// 열을 반복
for (int column = 0; column < t.ColumnCount; column++) {
// 테이블 셀 가져오기
PageTableAreaCell cell = t[row, column];
if (cell != null) {
// 테이블 셀 텍스트 인쇄
Console.Write(cell.Text);
Console.Write(" | ");
}
}
Console.WriteLine();
}
Console.WriteLine();
}
}
GroupDocs.Parser for .NET API는 모든 주요 플랫폼 및 운영 체제에서 지원됩니다. 아래 코드를 실행하기 전에 시스템에 다음 필수 구성 요소가 설치되어 있는지 확인하십시오.