.NET-API zum Extrahieren von Dokumentdaten

Bilder, rohen oder formatierten Text und Metadaten aus Dokumenten, Tabellenkalkulationen, Präsentationen, E-Mails und Archiven aus .NET-Apps extrahieren.


Download kostenlose Testversion

GroupDocs.Parser für .NET ist eine Text-, Metadaten- und Bildextraktions-API für Geschäftsanwendungen, die mit C#, ASP.NET und anderen .NET-Technologien entwickelt wurden. Es unterstützt die Extraktion von rohem, formatiertem und strukturiertem Text sowie Metadaten aus den Dateien unterstützter Formate. Durch GroupDocs.Parser für .NET können Ihre Anwendungen auch passwortgeschützte Dokumente für gängige Formate wie Textverarbeitungsdokumente, Excel-Tabellen, PowerPoint-Präsentationen, OneNote, PDF-Dateien und ZIP-Archive parsen.

GroupDocs.Parser for .NET Merkmale

Zählen Sie das Vorkommen von Wörtern in einzelnen oder mehreren Dateien statistisch

Extrahieren Sie Text und Metadaten aus Excel-Arbeitsblättern und Präsentationsvorlagen

Extrahieren Sie Textinhalte aus einer Datei oder einem Stream, ohne Document Reader zu installieren

Get Formatted Text from a Document using Fast or Standard Textextraktion Mode

Erkennen Sie den Medientyp von passwortgeschützten XML-Dokumenten und ziehen Sie Text daraus

Erhalten Sie programmgesteuert formatierten Text aus E-Mails und Anhängen

Zeichnen Sie Text aus einzelnen oder mehreren Seiten eines OneNote-Dokuments heraus

Extrahieren Sie Daten aus PDF-, MS Word-, Excel- und Präsentationsdokumenten

Extrahieren Sie Daten aus den PDF-Formularen und entnehmen Sie Text aus einer einfachen PDF-Datei oder einem PDF-Portfolio-Dokument

Holen Sie sich formatierten Text aus einer PowerPoint-Präsentation oder vertreiben Sie Text aus einer bestimmten Folie

Sammeln Sie rohen oder formatierten Text aus Zellen, Zeilen und Spalten aus einer Excel-Tabelle

Extrahieren Sie rohen oder HTML-formatierten Text aus einem Word-Dokument

HTML-Formatierer unterstützt die Formatierung von Absatz, Hyperlink, Schriftart, Überschriften, Listen und Tabellen

Ziehen Sie einzelne Sätze oder ganzen Text aus EPUB-, CHM-, Markdown- und FB2-Dateien heraus

Auszug aus dem Inhaltsverzeichnis von Datenbanken, PDF, EPUB, CHM & Textverarbeitungsdokumenten

Ziehen Sie Text mit intakter Inhaltsstruktur heraus und extrahieren Sie hervorgehobenen Text aus Dokumenten

Erhalten Sie Textbereich aus Dokumenten für die Analyse und zeichnen Sie Metadaten aus unterstützten Dokumentformaten

Erhalten Sie alle oder ausgewählte Bilder aus unterstützten Formaten und drehen Sie extrahierte Bilder

Entnehmen Sie Text aus Dateien in Zip-Archiven und OST-Containern und erkennen Sie Dateitypen von ZIP-Container-Elementen

Abrufen von Daten aus E-Mail-Container (Exchange-Webserver, POP3, IMAP)

Suchen Sie in Dokumenten nach einfachem Text, ganzen Wörtern und regulären Ausdrücken

Dokumentvorlage vorbereiten, Daten aus Dokument extrahieren und Datenfelder und Tabellen analysieren

Suchen und extrahieren Sie hervorgehobene Ausdrücke in Dokumenten

Holen Sie sich Text mit Plain Text Formatter (Einfach & ASCII) oder mit Markdown Formatter

Markdown Formatter unterstützt die Formatierung von Schriftarten, Hyperlinks, Überschriften, Listen und Tabellen

Führen Sie eine benutzerdefinierte Formatierung mit Kanten, Winkeln und Schnittpunkten durch, um einfachen Text zu formatieren

Tabellenlayout verschieben und Tabellen in einem rechteckigen Bereich anhand von Spaltentrennzeichen erkennen

Extrahieren Sie Text aus Formen, WordArt-Objekten und Textfeldern in Microsoft Office-Dateiformaten

Bilder in Dateien extrahieren – Speichern im JPG-, PNG-, GIF-, BMP-, PNG- oder WEBP-Format

Extrahieren von Text aus einem Dokument

Die Verwendung von GroupDocs.Parser for .NET API zum Extrahieren von Text aus einem Dokument ist einfach und mit nur wenigen Codezeilen möglich:

// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser("sample.docx"))
{
  // Text in den Reader extrahieren
  using(TextReader reader = parser.GetText())
  {
    // Text aus dem Dokument drucken
    // Wenn die Textextraktion nicht unterstützt wird, ist reader null
    Console.WriteLine(reader == null ? "Text extraction isn't supported." : reader.ReadToEnd());
  }
}

Unterstützung und Lernressourcen

GroupDocs.Parser bietet APIs zum Anzeigen von Dokumenten für andere beliebte Entwicklungsumgebungen

Back to top
De