GroupDocs.Parser für .NET ist eine Text-, Metadaten- und Bildextraktions-API für Geschäftsanwendungen, die mit C#, ASP.NET und anderen .NET-Technologien entwickelt wurden. Es unterstützt die Extraktion von rohem, formatiertem und strukturiertem Text sowie Metadaten aus den Dateien unterstützter Formate. Durch GroupDocs.Parser für .NET können Ihre Anwendungen auch passwortgeschützte Dokumente für gängige Formate wie Textverarbeitungsdokumente, Excel-Tabellen, PowerPoint-Präsentationen, OneNote, PDF-Dateien und ZIP-Archive parsen.
Die Verwendung von GroupDocs.Parser for .NET API zum Extrahieren von Text aus einem Dokument ist einfach und mit nur wenigen Codezeilen möglich:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser("sample.docx"))
{
// Text in den Reader extrahieren
using(TextReader reader = parser.GetText())
{
// Text aus dem Dokument drucken
// Wenn die Textextraktion nicht unterstützt wird, ist reader null
Console.WriteLine(reader == null ? "Text extraction isn't supported." : reader.ReadToEnd());
}
}