Ekstrak teks dari PDF Di C#

Ekstrak teks dari PDF dengan beberapa baris kode .NET.


Unduh Uji Coba Gratis

Bagaimana cara mengekstrak teks dari PDF file .NET API?

GroupDocs.Parser for .NET adalah teks, metadata, dan API ekstraktor gambar untuk aplikasi bisnis yang dikembangkan menggunakan C#, ASP,.NET, dan teknologi .NET lainnya. Ini mendukung ekstraksi teks mentah, diformat & terstruktur serta metadata dari file format yang didukung. Melalui GroupDocs.Parser for .NET, aplikasi Anda juga dapat melakukan penguraian dokumen yang dilindungi sandi untuk format populer, seperti Word pemrosesan dokumen, Excel spreadsheet, PowerPoint presentasi, OneNote, PDF file, dan ZIP arsip .

GroupDocs.Parser API adalah pilihan yang tepat untuk solusi korporat yang membutuhkan fitur ekstraksi teks file. API ini didukung dengan baik di semua sistem operasi dan platform utama termasuk Frameworks: .NET Framework, .NET Standard, .NET Core, Mono.

Ekstrak teks dari PDF di .NET

GroupDocs.Parser for .NET memudahkan pengembang C# untuk mengekstrak teks dari file PDF dengan menerapkan beberapa langkah mudah.

  • Membuat instance objek Parser untuk dokumen awal;
  • Panggil metode GetText dan dapatkan TextReader objek;
  • Periksa apakah pembaca tidak null (ekstraksi teks didukung untuk dokumen);
  • Membaca teks dari pembaca.

Cara mengekstrak teks dari file PDF menggunakan kode contoh C#

// Ekstrak teks dari file PDF menggunakan GroupDocs.Parser API
// Buat instance kelas Parser
using (Parser parser = new Parser(filePath)) {
    // Ekstrak teks ke pembaca
    using (TextReader reader = parser.GetText()) {
        // Cetak teks dari dokumen
        // Jika ekstraksi teks tidak didukung, pembaca adalah null
        Console.WriteLine(reader == null ? "Ekstraksi teks tidak didukung" : reader.ReadToEnd());
    }
}

Persyaratan sistem

GroupDocs.Parser for .NET API didukung di semua platform dan sistem operasi utama. Sebelum menjalankan kode di bawah ini, harap pastikan bahwa Anda telah menginstal prasyarat berikut di sistem Anda.

  • Sistem Operasi: Microsoft Windows, Linux, MacOS
  • Lingkungan Pengembangan: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Kerangka kerja
  • Unduh versi terbaru GroupDocs.Parser for .NET dari Nuget

Mengapa Menggunakan GroupDocs.Parser for .NET

  • Dukungan ekstraksi teks biasa dari dokumen yang didukung
  • Penguraian dokumen melalui templat yang ditentukan pengguna
  • Sepenuhnya mendukung ekstraksi teks terstruktur
  • Pencarian teks melalui kata kunci serta ekspresi reguler
  • Ekstrak teks yang diformat, metadata, gambar, wadah, dan lampiran
  • Ekstrak daftar isi untuk beberapa format dokumen yang didukung
  • Mengurai data formulir dari PDF dokumen
  • Ekstrak hyperlink dari dokumen

Demo Langsung - Ekstrak teks dari PDF Online

Ekstrak teks dari file PDF sekarang juga dengan mengunjungi situs web GroupDocs.Parser Demo Langsung. Demo langsung memiliki manfaat berikut.

Tidak perlu mengunduh API

Tidak perlu menulis kode apa pun

Cukup unggah file sumbernya

Dapatkan tautan unduhan untuk menyimpan file

Ekstrak Teks Dari Format Dokumen Lain

.NET mengurai dokumen & API ekstraksi teks untuk format file dan gambar. Ekstrak data untuk beberapa format file populer seperti yang dinyatakan di bawah ini.

PPSX

(PowerPoint Slide Show)

PPT

(Microsoft PowerPoint 97-2003)

PPTX

(Open XML presentation Format)

RTF

(Rich Text Format)

TEX

(LaTeX Source Document)

VDX

(The 7th Guest Video File)

VSDM

(Visio Macro-Enabled Drawing)

VSDX

(Visio Drawing)

VSSM

(Visio Macro-Enabled Stencil File)

VSSX

(Visio Stencil File)

VSTM

(Visio Macro-Enabled Drawing Template)

VSTX

(Visio Drawing Template)

VSX

(Visio Stencil XML File)

VTX

(Anim8or 3D Model)

XLAM

(Excel Macro-Enabled Add-In)

XLS

(Microsoft Excel Spreadsheet (Legacy))

Back to top
 Indonesian