GroupDocs.Parser auf einen Blick

API zum Durchführen von Dokumentenverarbeitung in .NET-Anwendungen

Illustration parser

Daten aus Dokumenten extrahieren

GroupDocs.Parser for .NET API ermöglicht es Ihnen, Text, Metadaten und Bilder aus einer Vielzahl von Dateiformaten wie Office-Dokumenten, E-Mails, Anhängen und Archiven zu extrahieren. Dieses leistungsstarke Tool hilft Ihnen, wertvolle Informationen effizient zuzugreifen und zu verarbeiten, die in diesen Dateien für verschiedene Anwendungen wie Datenanalyse, Suchmaschinenindizierung oder Content-Management-Systeme enthalten sind.

Dokumente parsen

Extrahieren Sie verschiedene Elemente wie Hyperlinks, Tabellen, QR-Codes, Barcodes und Daten aus PDF-Formularen. Auch beliebige Informationen aus Dokumenten mithilfe benutzerdefinierter Vorlagen parsen.

Ergebnisse anpassen

.NET API ermöglicht es Ihnen, Daten in verschiedenen Formaten wie Rohdaten, strukturiert, HTML oder Markdown zu ermitteln. Darüber hinaus bietet die API eine Suchfunktion zum Auffinden spezifischer Wörter oder Phrasen im Text der Dokumente.

Plattformunabhängigkeit

GroupDocs.Parser for .NET unterstützt die folgenden Betriebssysteme, Frameworks und Paketmanager.

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

Unterstützte Dateiformate

GroupDocs.Parser for .NET unterstützt Operationen mit den folgenden Dateiformaten.

Microsoft Office-Formate

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Bilder & andere Formate

  • Portabel: PDF
  • Bilder: JPG, BMP, PNG, TIFF, GIF
  • Andere Büroformate: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Weitere Formate

  • Web: HTML, MHTML
  • Archive: ZIP, TAR, 7Z
  • e-Books: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET Funktionen

Daten aus PDFs, Office-Dokumenten und Bildern schnell und präzise extrahieren

Feature icon

Text extrahieren

Textuelle Informationen aus verschiedenen Dateiformaten wie Office-Dokumenten, PDF-Dateien und Bildern extrahieren, um eine einfache Lesbarkeit und Analyse zu gewährleisten.

Feature icon

Bilder extrahieren

Visuelle Inhalte aus unterschiedlichen Quellen wie Office-Dokumenten und PDF-Dateien abrufen, um einen bequemen Zugriff zu erhalten.

Feature icon

QR-Codes scannen

Erkennen und Dekodieren von QR-Codes, die in Office-Dokumenten, PDF-Dateien oder visuellen Inhalten vorhanden sind, um Informationen effizient abzurufen.

Feature icon

Daten aus E-Mail-Anhängen und Archiven extrahieren

Wertvolle Informationen aus E-Mail-Nachrichten, Dateianhängen und komprimierten Datenquellen zusammenstellen, um eine effektive Analyse und Nutzung zu gewährleisten.

Feature icon

Tabellen extrahieren

Identifizieren und extrahieren Sie tabellarische Daten aus PDF-Dokumenten für eine organisierte Analyse und Nutzung.

Feature icon

Hyperlinks extrahieren

Lokalisieren und extrahieren Sie Hyperlinks und E-Mail-Adressen in Office-Dokumenten oder PDF-Dateien für einen effizienten Zugriff.

Feature icon

PDF-Formulare parsen

PDF-Formulare sind digitale Dokumente mit ausfüllbaren Feldern zur Benutzerinteraktion, die es ihnen ermöglichen, Informationen elektronisch einzugeben. .NET-API kann verwendet werden, um Daten aus diesen Formularen für eine effiziente Verarbeitung zu extrahieren.

Feature icon

Daten durch Vorlagen parsen

Erstellen Sie benutzerdefinierte Vorlagen und verwenden Sie diese mit der .NET-API, um spezifische Informationen aus PDF-Dateien zu extrahieren und die Datenextraktionsprozesse zu vereinfachen.

Feature icon

Text in Dokumenten suchen

Schnell spezifische Wörter oder Muster innerhalb von Dokumenten finden.

Codebeispiele

Einige Anwendungsfälle typischer GroupDocs.Parser for .NET-Operationen

Bilder aus PDF-Dokumenten extrahieren

GroupDocs.Parser for .NET erleichtert es C#-Entwicklern, Bilder aus Dokumenten zu extrahieren:

Bilder aus PDF-Dokumenten in C# extrahieren

// Erstellen Sie eine Instanz der Parser-Klasse
using (var parser = new Parser("source.pptx"))
{
    // Bilder extrahieren
    var images = parser.GetImages();

    // Überprüfen, ob etwas extrahiert wurde
    if (images == null)
    {
        return;
    }
    // Über Bilder iterieren
    foreach (PageImageArea image in images)
    {
        // Seitenindex, Rechteck und Bildtyp ausgeben
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

Barcodes aus Bildern extrahieren

Verwenden Sie unsere .NET-API, um Barcodes aus Bildern zu extrahieren:

Barcode aus Bildern in C# extrahieren

// Laden Sie das Quellbild in Parser
using (var parser = new Parser("source.jpg"))
{
    // Überprüfen, ob die Datei die Barcode-Extraktion unterstützt
    if (parser.Features.Barcodes)
    {
        // Barcodes aus der Datei extrahieren
        var barcodes = parser.GetBarcodes();

        // Über Barcodes iterieren
        foreach (var barcode in barcodes)
        {
            // Seitenindex ausgeben
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Barcode-Wert ausgeben
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

Bereit, loszulegen?

Laden Sie GroupDocs.Parser kostenlos herunter oder holen Sie sich eine Testlizenz für vollen Zugriff!

Nützliche Ressourcen

Erforschen Sie die Dokumentation, Code -Beispiele und die Unterstützung der Community, um Ihre Erfahrungen zu verbessern.

Tipps zur temporären Lizenz

1
Melden Sie sich mit Ihrer geschäftlichen E-Mail-Adresse an. Kostenlose E-Mail-Dienste sind nicht zulässig.
2
Klicken Sie im zweiten Schritt auf die Schaltfläche Provisorische Lizenz anfordern.
 Deutsch