GroupDocs.Parser für .NET ist eine Text-, Metadaten- und Bildextraktions-API für Geschäftsanwendungen, die mit C#, ASP.NET und anderen .NET-Technologien entwickelt wurden. Es unterstützt die Extraktion von rohem, formatiertem und strukturiertem Text sowie Metadaten aus den Dateien unterstützter Formate. Durch GroupDocs.Parser für .NET können Ihre Anwendungen auch passwortgeschützte Dokumente für gängige Formate wie Textverarbeitungsdokumente, Excel-Tabellen, PowerPoint-Präsentationen, OneNote, PDF-Dateien und ZIP-Archive parsen.
Zählen Sie das Vorkommen von Wörtern in einzelnen oder mehreren Dateien statistisch
Extrahieren Sie Text und Metadaten aus Excel-Arbeitsblättern und Präsentationsvorlagen
Extrahieren Sie Textinhalte aus einer Datei oder einem Stream, ohne Document Reader zu installieren
Get Formatted Text from a Document using Fast or Standard Textextraktion Mode
Erkennen Sie den Medientyp von passwortgeschützten XML-Dokumenten und ziehen Sie Text daraus
Erhalten Sie programmgesteuert formatierten Text aus E-Mails und Anhängen
Zeichnen Sie Text aus einzelnen oder mehreren Seiten eines OneNote-Dokuments heraus
Extrahieren Sie Daten aus PDF-, MS Word-, Excel- und Präsentationsdokumenten
Extrahieren Sie Daten aus den PDF-Formularen und entnehmen Sie Text aus einer einfachen PDF-Datei oder einem PDF-Portfolio-Dokument
Holen Sie sich formatierten Text aus einer PowerPoint-Präsentation oder vertreiben Sie Text aus einer bestimmten Folie
Sammeln Sie rohen oder formatierten Text aus Zellen, Zeilen und Spalten aus einer Excel-Tabelle
Extrahieren Sie rohen oder HTML-formatierten Text aus einem Word-Dokument
HTML-Formatierer unterstützt die Formatierung von Absatz, Hyperlink, Schriftart, Überschriften, Listen und Tabellen
Ziehen Sie einzelne Sätze oder ganzen Text aus EPUB-, CHM-, Markdown- und FB2-Dateien heraus
Auszug aus dem Inhaltsverzeichnis von Datenbanken, PDF, EPUB, CHM & Textverarbeitungsdokumenten
Ziehen Sie Text mit intakter Inhaltsstruktur heraus und extrahieren Sie hervorgehobenen Text aus Dokumenten
Erhalten Sie Textbereich aus Dokumenten für die Analyse und zeichnen Sie Metadaten aus unterstützten Dokumentformaten
Erhalten Sie alle oder ausgewählte Bilder aus unterstützten Formaten und drehen Sie extrahierte Bilder
Entnehmen Sie Text aus Dateien in Zip-Archiven und OST-Containern und erkennen Sie Dateitypen von ZIP-Container-Elementen
Abrufen von Daten aus E-Mail-Container (Exchange-Webserver, POP3, IMAP)
Suchen Sie in Dokumenten nach einfachem Text, ganzen Wörtern und regulären Ausdrücken
Dokumentvorlage vorbereiten, Daten aus Dokument extrahieren und Datenfelder und Tabellen analysieren
Suchen und extrahieren Sie hervorgehobene Ausdrücke in Dokumenten
Holen Sie sich Text mit Plain Text Formatter (Einfach & ASCII) oder mit Markdown Formatter
Markdown Formatter unterstützt die Formatierung von Schriftarten, Hyperlinks, Überschriften, Listen und Tabellen
Führen Sie eine benutzerdefinierte Formatierung mit Kanten, Winkeln und Schnittpunkten durch, um einfachen Text zu formatieren
Tabellenlayout verschieben und Tabellen in einem rechteckigen Bereich anhand von Spaltentrennzeichen erkennen
Extrahieren Sie Text aus Formen, WordArt-Objekten und Textfeldern in Microsoft Office-Dateiformaten
Bilder in Dateien extrahieren – Speichern im JPG-, PNG-, GIF-, BMP-, PNG- oder WEBP-Format
Die Verwendung von GroupDocs.Parser for .NET API zum Extrahieren von Text aus einem Dokument ist einfach und mit nur wenigen Codezeilen möglich:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser("sample.docx"))
{
// Text in den Reader extrahieren
using(TextReader reader = parser.GetText())
{
// Text aus dem Dokument drucken
// Wenn die Textextraktion nicht unterstützt wird, ist reader null
Console.WriteLine(reader == null ? "Text extraction isn't supported." : reader.ReadToEnd());
}
}