GroupDocs.Parser를 사용하여 .NET 환경 내에서 DOCX 파일에서 테이블을 추출하기 위한 지침을 따라 주십시오:
- Parser 인스턴스를 초기화하고 DOCX 문서를 로드합니다.
- 입력 형식에 대한 테이블 추출 지원 여부를 확인합니다.
- 파일에서 테이블 내용을 추출합니다.
- 보고서 작성, 자동화 또는 분석을 위해 구조화된 테이블 데이터를 사용합니다.
GroupDocs.Parser를 사용하여 .NET 환경 내에서 DOCX 파일에서 테이블을 추출하기 위한 지침을 따라 주십시오:
// Parser를 사용하여 테이블 데이터가 포함된 문서를 엽니다.
using (Parser parser = new Parser("input.docx")) {
// 해당 형식이 테이블 인식을 지원하는지 확인합니다.
if (!parser.Features.Tables) {
Console.WriteLine("테이블 파싱을 지원하지 않는 문서를 처리합니다.");
return;
}
// 테이블 구조가 어떻게 인식되어야 하는지 정의합니다.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// 테이블 데이터에 대한 추출 매개변수를 지정합니다.
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// 파일 내용에서 테이블을 추출합니다.
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// 감지된 각 테이블을 반복합니다.
foreach (PageTableArea t in tables)
{
}
}
테이블 파싱 외에도 GroupDocs.Parser은 문서 자동화를 위한 텍스트 블록, 이미지, 메타데이터 및 기타 구조화된 데이터를 추출할 수 있습니다.
DOCX, XLSX, PDF, HTML 및 유사한 형식에서 높은 정밀도로 표 형식 데이터를 추출합니다.
형식 손실 없이 문서 및 스프레드시트에서 테이블 데이터를 효율적으로 검색합니다.
출력을 위한 레이아웃 감지, 열 정렬, 머리말/바닥글 옵션을 조정하여 정확한 제어를 제공합니다.
이 코드 샘플은 GroupDocs.Parser을 사용하여 XLSX 파일에서 테이블 데이터를 읽고 반복하는 방법을 보여줍니다.
// Parser API를 사용하여 Excel 파일을 엽니다.
using (Parser parser = new Parser("input.xlsx"))
{
// 파일에서 테이블을 추출할 수 없으면 종료합니다.
if (!parser.Features.Tables)
{
return;
}
// 레이아웃 규칙을 사용하여 표 형식 콘텐츠의 위치를 찾습니다.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// 테이블에 대한 추출 매개변수를 설정합니다.
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// 테이블 추출 작업을 수행합니다.
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// 감지된 각 테이블 구조를 살펴봅니다.
foreach (PageTableArea t in tables)
{
// 테이블의 각 행을 반복합니다.
for (int row = 0; row < t.RowCount; row++)
{
// 각 행의 셀을 반복합니다.
for (int column = 0; column < t.ColumnCount; column++)
{
// 현재 테이블 셀에 액세스합니다.
PageTableAreaCell cell = t[row, column];
if (cell != null)
{
// 각 셀의 텍스트 내용을 표시합니다.
Console.Write(cell.Text);
Console.Write(" | ");
}
}
}
}
}