Ví dụ này cho thấy cách trích xuất và lặp qua nội dung bảng trong tập tin Excel (XLSX) bằng cách sử dụng GroupDocs.Parser.
Java
// Khởi tạo Parser với tệp Excel
try (Parser parser = new Parser("input.pdf"))
{
// Thoát nếu việc trích xuất bảng không được hỗ trợ cho tài liệu này
if (!parser.getFeatures().isTables())
{
return;
}
// Áp dụng quy tắc để xác định bố cục bảng
TemplateTableLayout layout = new TemplateTableLayout(
java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));
// Cấu hình môi trường cho việc trích xuất bảng
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// Kích hoạt quy trình trích xuất
Iterable<PageTableArea> tables = parser.getTables(options);
// Lặp qua tất cả các cấu trúc bảng đã phân tích
for (PageTableArea t : tables)
{
// Lặp qua từng hàng trong bảng
for (int row = 0; row < t.getRowCount(); row++)
{
// Xử lý từng ô trong hàng hiện tại
for (int column = 0; column < t.getColumnCount(); column++)
{
// Truy cập và đọc nội dung của ô hiện tại
PageTableAreaCell cell = t.getCell(row, column);
if (cell != null)
{
// Xuất giá trị văn bản của từng ô bảng
System.out.print(cell.getText());
System.out.print(" | ");
}
}
}
}
}