Parser für Net

Document Parser SDK für .NET

Fügen Sie Ihren .NET‑Apps eine schnelle und präzise Dokumentenparsing hinzu und extrahieren Sie Text, Bilder, Metadaten und strukturierte Daten aus Dokumenten und Bildern.

NuGet-Download Kostenlose Testversion starten

Version 26.6.1 veröffentlicht

Erfahren Sie, was neu ist

// Übergeben Sie die Quelldatei an die Parser‑Instanz
using (var parser = new Parser("source.pdf"))
{
    // Übergeben Sie den Dokumententext an TextReader
    using (var textReader = parser.GetText())
    {
        // Dokumententext verarbeiten
        Console.WriteLine(textReader?.ReadToEnd());
    }
}

dotnet add package GroupDocs.Parser

GroupDocs.Parser auf einen Blick

Document Parser SDK für hochpräzises Dokumentenparsing in .NET‑Anwendungen

Daten aus Dokumenten extrahieren

GroupDocs.Parser for .NET API ermöglicht das Abrufen von Text, Metadaten und Bildern aus einer Vielzahl von Dateiformaten wie Office-Dokumenten, E‑Mails, Anhängen und Archiven. Dieses leistungsstarke Werkzeug hilft Ihnen, effizient auf wertvolle Informationen in diesen Dateien zuzugreifen und sie zu verarbeiten, z. B. für Datenanalyse, Suchmaschinen‑Indexierung oder Content‑Management‑Systeme.

Dokumente parsen

Extrahieren Sie verschiedene Elemente wie Hyperlinks, Tabellen, QR‑Codes, Barcodes und Daten aus PDF‑Formularen. Außerdem können Sie beliebige Informationen aus Dokumenten mithilfe benutzerdefinierter Vorlagen parsen.

Ergebnisse anpassen

.NET API ermöglicht das Abrufen von Daten in verschiedenen Formaten wie Rohdaten, strukturiert, HTML oder Markdown. Zusätzlich bietet die API eine Suchfunktion, um bestimmte Wörter oder Phrasen im Text von Dokumenten zu finden.

Plattformunabhängigkeit

GroupDocs.Parser for .NET unterstützt die folgenden Betriebssysteme, Frameworks und Paketmanager

Unterstützte Dateiformate

GroupDocs.Parser for .NET unterstützt Vorgänge mit den folgenden Dateiformaten.

Microsoft‑Office‑Formate

Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Bilder & andere Formate

Tragbar: PDF
Bilder: JPG, BMP, PNG, TIFF, GIF
Andere Office-Formate: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Weitere Formate

Web: HTML, MHTML
Archive: ZIP, TAR, 7Z
eBooks: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET Funktionen

Extrahieren Sie Daten aus PDFs, Office‑Dokumenten, Bildern und anderen Formaten schnell und präzise mit unserem .NET Document Parser SDK

Text extrahieren

Extrahieren Sie Textinformationen aus verschiedenen Dateiformaten wie Office‑Dokumenten, PDF‑Dateien und Bildern für einfache Lesbarkeit und Analyse.

Bilder extrahieren

Rufen Sie visuelle Inhalte aus verschiedenen Quellen wie Office‑Dokumenten und PDF‑Dateien ab für bequemen Zugriff und Nutzung.

QR‑Codes scannen

Erkennen und dekodieren Sie QR‑Codes, die in Office‑Dokumenten, PDF‑Dateien oder visuellen Inhalten enthalten sind, für effiziente Informationsbeschaffung.

Daten aus E‑Mail‑Anhängen und Archiven extrahieren

Sammeln Sie wertvolle Informationen aus E-Mails, Dateianhängen und komprimierten Datenquellen für eine effektive Analyse und Nutzung.

Tabellen extrahieren

Identifizieren und extrahieren Sie tabellarische Daten aus PDF-Dokumenten für eine strukturierte Analyse und Verwendung.

Hyperlinks extrahieren

Ermitteln und extrahieren Sie Hyperlinks und E-Mail-Adressen in Office-Dokumenten oder PDF-Dateien für einen effizienten Zugriff.

PDF-Formulare parsen

PDF-Formulare sind digitale Dokumente mit ausfüllbaren Feldern für die Benutzerinteraktion, die die elektronische Eingabe von Informationen ermöglichen. Die .NET API kann verwendet werden, um Daten aus diesen Formularen für eine effiziente Verarbeitung zu extrahieren.

Daten mithilfe von Vorlagen parsen

Erstellen Sie benutzerdefinierte Vorlagen und verwenden Sie diese mit der .NET API, um spezifische Informationen aus PDF-Dateien zu parsen und so den Datenextraktionsprozess zu vereinfachen.

Text in Dokumenten suchen

Suchen Sie schnell bestimmte Wörter oder Muster in Dokumenten.

Codebeispiele

Einige Anwendungsfälle typischer GroupDocs.Parser for .NET-Operationen

Bilder aus PDF-Dokumenten extrahieren

GroupDocs.Parser for .NET erleichtert

C# Entwicklern das Extrahieren von Bildern aus Dokumenten:

Bilder aus PDF-Dokumenten in C# extrahieren

// Erstellen Sie eine Instanz der Klasse Parser style=color:#00f>using (var parser = new Parser("source.pptx")) { // Bilder extrahieren var images = parser.GetImages(); // Prüfen, ob etwas extrahiert wurde if (images == null) { return; } // Durchlaufen Sie die Bilder foreach (PageImageArea image in images) { // Seitenindex, Rechteck und Bildtyp ausgeben Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); } }

`Barcodes aus Bildern extrahieren`

Verwenden Sie unsere .NET‑API, um Barcodes aus Bildern zu extrahieren:

`Barcodes aus Bildern in C# extrahieren`

// Quellbild in Parser laden
using (var parser = new Parser("source.jpg"))
{
    // Prüfen, ob die Datei die Barcode-Extraktion unterstützt
    if (parser.Features.Barcodes)
    {
        // Barcodes aus der Datei extrahieren
        var barcodes = parser.GetBarcodes();

        // Barcodes durchlaufen
        foreach (var barcode in barcodes)
        {
            // Seitenindex ausgeben
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Barcode-Wert ausgeben
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

`Bereit, loszulegen?`

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

NuGet-Download
Kostenlose Testversion starten

`Nützliche Ressourcen`

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.


Dokumentation
API-Referenz
Code-Beispiele
Freie Unterstützung
Bezahlte Unterstützung