GroupDocs.Parserを使用して、あなたの.NET環境内でXLSXファイルからテーブルを抽出するための手順を次の通りに従ってください:
- Parserインスタンスを初期化し、XLSX文書をロードします。
- 入力フォーマットがテーブル抽出をサポートしているか確認します。
- ファイルからテーブルコンテンツを抽出します。
- 出力のために構造化されたテーブルデータを使用します。
GroupDocs.Parserを使用して、あなたの.NET環境内でXLSXファイルからテーブルを抽出するための手順を次の通りに従ってください:
// Parserを使用してテーブルデータを含む文書を開く
using (Parser parser = new Parser("input.xlsx")) {
// フォーマットがテーブル認識をサポートしているか確認する
if (!parser.Features.Tables) {
Console.WriteLine("テーブル解析をサポートしない文書を処理する");
return;
}
// テーブル構造をどのように認識するかを定義する
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// テーブルデータの抽出パラメータを指定する
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// ファイルコンテンツからテーブルを抽出する
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// 検出された各テーブルをループする
foreach (PageTableArea t in tables)
{
}
}
テーブル解析に加え、GroupDocs.Parserは、文書自動化を促進するために、テキストブロック、画像、メタデータ、およびその他の構造化データを抽出できます。
DOCX、XLSX、PDF、HTMLなどのフォーマットから高精度でタブラー・データを抽出します。
ドキュメントやスプレッドシートからフォーマットの損失なしに効率的にテーブルデータを取得します。
レイアウト検出、列の整列、ヘッダー/フッターオプションを調整して出力を正確に制御します。
このコードサンプルは、GroupDocs.Parserを使用してXLSXファイル内のテーブルデータを読み取り、イテレートする方法を示しています。
// Parser APIを使用してExcelファイルを開く
using (Parser parser = new Parser("input.xlsx"))
{
// テーブルをファイルから抽出できない場合は終了する
if (!parser.Features.Tables)
{
return;
}
// レイアウトルールを使用してタブラーコンテンツを特定する
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
// テーブルの抽出パラメータを設定する
PageTableAreaOptions options = new PageTableAreaOptions(layout);
// テーブル抽出操作を実行する
IEnumerable<PageTableArea> tables = parser.GetTables(options);
// 検出された各テーブル構造をループする
foreach (PageTableArea t in tables)
{
// テーブル内の各行をイテレートする
for (int row = 0; row < t.RowCount; row++)
{
// 各行のセルをループする
for (int column = 0; column < t.ColumnCount; column++)
{
// 現在のテーブルセルにアクセスする
PageTableAreaCell cell = t[row, column];
if (cell != null)
{
// 各セルのテキストコンテンツを表示する
Console.Write(cell.Text);
Console.Write(" | ");
}
}
}
}
}