GroupDocs.Parser for .NET

Ekstrak tabel dari EPUB menggunakan C#

Identifikasi dengan cepat dan ekstrak struktur tabel dari PDF, Word, Excel, dan format file lainnya menggunakan GroupDocs.Parser dalam proyek .NET Anda.

Langkah-langkah untuk ekstrak tabel dari Epub dalam C#

Ikuti instruksi ini untuk mengekstrak tabel dari file EPUB menggunakan GroupDocs.Parser dalam lingkungan .NET Anda:

  1. Inisialisasi instance Parser dan muat dokumen EPUB Anda.
  2. Periksa apakah ekstraksi tabel didukung untuk format input.
  3. Ekstrak konten tabel dari file.
  4. Gunakan data tabel terstruktur untuk pelaporan, otomatisasi, atau analitik.
// Buka dokumen yang berisi data tabel menggunakan Parser
using (Parser parser = new Parser("input.epub")) {

    // Periksa apakah format mendukung pengenalan tabel
    if (!parser.Features.Tables) {
        Console.WriteLine("Tangani dokumen yang tidak mendukung penguraian tabel");
        return;
    }

    // Tentukan bagaimana struktur tabel harus dikenali
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // Tentukan parameter ekstraksi untuk data tabel
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Ekstrak tabel dari konten file
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  Jelajahi setiap tabel yang terdeteksi
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
klik untuk menyalin
disalin
Lebih banyak contoh Dokumentasi

Kemampuan ekstraksi data yang kuat

Selain penguraian tabel, GroupDocs.Parser dapat mengekstrak konten kaya seperti blok teks, gambar, metadata, dan data terstruktur lainnya untuk memfasilitasi otomatisasi dokumen.

Pengenalan tabel dan ekstraksi konten

Deteksi tabel multi-format yang akurat

Ekstrak data tabular dari DOCX, XLSX, PDF, HTML, dan format serupa dengan presisi tinggi.

Analisis struktur tabel dari file

Ambil data tabel dari dokumen dan spreadsheet secara efisien tanpa kehilangan format.

Konfigurasi ekstraksi tabel yang fleksibel

Sesuaikan deteksi tata letak, penyelarasan kolom, dan opsi header/footer untuk kontrol tepat atas hasil.

Cara mengekstrak tabel dari spreadsheet Excel

Contoh kode ini menunjukkan cara membaca dan menjelajahi data tabel dalam file XLSX menggunakan GroupDocs.Parser.

C#

//  Buka file Excel menggunakan API Parser
using (Parser parser = new Parser("input.xlsx"))
{
    // Keluar jika tabel tidak dapat diekstrak dari file
    if (!parser.Features.Tables)
    {
        return;
    }

    // Gunakan aturan tata letak untuk menemukan konten tabular
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // Atur parameter ekstraksi untuk tabel
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Lakukan operasi ekstraksi tabel
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // Jelajahi setiap struktur tabel yang terdeteksi
    foreach (PageTableArea t in tables)
    {
        // Iterasi melalui setiap baris dalam tabel
        for (int row = 0; row < t.RowCount; row++)
        {
            // Jelajahi sel-sel dalam setiap baris
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // Akses sel tabel saat ini
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // Tampilkan konten teks dari setiap sel
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

Tentang API GroupDocs.Parser for .NET

GroupDocs.Parser adalah API penguraian dokumen yang komprehensif dibangun untuk pengembang .NET. API ini memungkinkan ekstraksi teks, tabel, gambar, hyperlink, dan elemen terstruktur lainnya secara akurat dari format seperti PDF, DOCX, XLSX, PPTX, dan banyak lagi—tanpa perlu perangkat lunak pihak ketiga.
Pelajari lebih lanjut
About illustration

Siap untuk memulai?

Unduh GroupDocs.Parser secara gratis atau dapatkan lisensi uji coba untuk akses penuh!

Sumber daya yang berguna

Jelajahi dokumentasi, sampel kode, dan dukungan masyarakat untuk meningkatkan pengalaman Anda.

Format yang didukung untuk ekstraksi tabel

GroupDocs.Parser dapat mengekstrak data tabel dari berbagai jenis dokumen. Berikut adalah format yang paling sering digunakan untuk penguraian tabel terstruktur.

Tip lisensi sementara

1
Daftar dengan email kantor Anda. Layanan email gratis tidak diperbolehkan.
2
Gunakan tombol Dapatkan lisensi sementara pada langkah kedua.
 Indonesian