GroupDocs.Parser for .NET

Ekstrak teks dari RTF menggunakan C#

Ekstrak teks yang mudah dibaca dan terstruktur dari PDF, Word, Excel, dan berbagai jenis file lainnya menggunakan GroupDocs.Parser dalam solusi .NET Anda.

Langkah untuk mengekstrak teks dari Rtf dalam C#

Anda dapat mengekstrak teks yang bersih dan terstruktur dari dokumen RTF dalam aplikasi .NET dengan GroupDocs.Parser dengan mengikuti langkah-langkah berikut:

  1. Buka dokumen RTF menggunakan instance Parser.
  2. Ekstrak teks dari konten file.
  3. Periksa hasilnya untuk memastikan ekstraksi teks berhasil.
  4. Gunakan teks yang diekstrak dalam logika bisnis Anda, pengindeksan, atau jalur data.
// Muat dokumen Anda ke dalam Parser
using (Parser parser = new Parser("input.rtf")) {

    // Ekstrak semua konten teks dari file tersebut
    using (TextReader reader = parser.GetText()) 
    {
        // Jika teks tidak tersedia, hasilnya akan bernilai null
        // Gunakan teks yang diekstrak di aplikasi Anda
        Console.WriteLine(reader == null ? 
            "Ekstraksi teks tidak didukung untuk format ini" : reader.ReadToEnd());
    }
}
dotnet add package GroupDocs.Parser
klik untuk menyalin
disalin
Lebih banyak contoh Dokumentasi

Fitur ekstraksi konten yang komprehensif

Selain teks biasa, GroupDocs.Parser dapat mengekstrak gambar, elemen terstruktur, dan metadata untuk mendukung analisis konten, transformasi, dan otomatisasi.

Pengenalan teks dan pemrosesan dokumen terstruktur

Ekstraksi teks dari berbagai jenis file

Dapatkan teks biasa atau terstruktur dari format seperti PDF, DOCX, XLSX, PPTX, HTML, dan format lainnya.

Proses teks dari dokumen dan visual

Ekstrak teks dari gambar yang dipindai, presentasi, spreadsheet, dan dokumen digital sambil mempertahankan struktur.

Konfigurasi ekstraksi teks yang canggih

Kustomisasi cara teks dideteksi—definisikan rentang halaman, wilayah tata letak, dan sesuaikan output untuk akurasi maksimum.

Cara mengekstrak area teks dari file PPTX

Contoh kode ini menunjukkan cara mengambil konten teks bersama dengan koordinat area dari file PowerPoint menggunakan GroupDocs.Parser.

C#

//  Muat presentasi PowerPoint dengan Parser
using (Parser parser = new Parser("input.pptx"))
{
    // Ekstrak semua rectangle area teks dari dokumen
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();

    // Keluar jika ekstraksi area teks tidak tersedia
    if (areas == null)
    {
        return;
    }

    // Loop melalui setiap area teks pada halaman
    foreach (PageTextArea a in areas)
    {
        // Akses indeks halaman, rectangle area, dan nilai teks
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Tentang API GroupDocs.Parser for .NET

GroupDocs.Parser adalah API pemrosesan dokumen berkinerja tinggi untuk pengembang .NET. Ini menyederhanakan ekstraksi teks, gambar, tabel, dan konten terstruktur dari berbagai format file termasuk PDF, DOCX, XLSX, PPTX, dan lainnya—tanpa bergantung pada pustaka pihak ketiga.
Pelajari lebih lanjut
About illustration

Siap untuk memulai?

Unduh GroupDocs.Parser secara gratis atau dapatkan lisensi uji coba untuk akses penuh!

Sumber daya yang berguna

Jelajahi dokumentasi, sampel kode, dan dukungan masyarakat untuk meningkatkan pengalaman Anda.

Format yang Didukung untuk Ekstraksi Teks

GroupDocs.Parser memungkinkan ekstraksi teks dari berbagai jenis dokumen dan gambar. Jelajahi format-format yang umum didukung sebagaimana tertera di bawah.

Tip lisensi sementara

1
Daftar dengan email kantor Anda. Layanan email gratis tidak diperbolehkan.
2
Gunakan tombol Dapatkan lisensi sementara pada langkah kedua.
 Indonesian