GroupDocs.Parser for .NET ist eine Text-, Metadaten- und Bildextraktor-API für Geschäftsanwendungen, die mit C#, ASP.NET und anderen .NET Technologien entwickelt wurden. Es unterstützt die Extraktion von rohem, formatiertem und strukturiertem Text sowie Metadaten aus den Dateien unterstützter Formate. Bis GroupDocs.Parser for .NET können Ihre Anwendungen auch das Parsen passwortgeschützter Dokumente für gängige Formate wie Word Verarbeitungsdokumente, Excel Tabellenkalkulationen, PowerPoint Präsentationen, OneNote, PDF Dateien und ZIP Archive durchführen .
Die GroupDocs.Parser API ist die richtige Wahl für Unternehmenslösungen, die eine Funktion zum Extrahieren von Dateitext benötigen. Diese APIs werden auf allen wichtigen Betriebssystemen und Plattformen, einschließlich Frameworks: .NET Framework, .NET Standard, .NET Core, Mono, gut unterstützt.
GroupDocs.Parser for .NET erleichtert C#-Entwicklern das Extrahieren eines Textes aus einer PDF-Datei durch die Implementierung einiger einfacher Schritte.
// Extrahieren Sie Text aus der Datei PDF mit der API GroupDocs.Parser
// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath)) {
// Extrahieren Sie einen Text in den Reader
using (TextReader reader = parser.GetText()) {
// Drucken Sie einen Text aus dem Dokument
// Wenn die Textextraktion nicht unterstützt wird, ist ein Leser null
Console.WriteLine(reader == null ? "Textextraktion wird nicht unterstützt" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET APIs werden auf allen wichtigen Plattformen und Betriebssystemen unterstützt. Bevor Sie den folgenden Code ausführen, stellen Sie bitte sicher, dass die folgenden Voraussetzungen auf Ihrem System installiert sind.
Extrahieren Sie jetzt Text aus der Datei PDF, indem Sie die Website GroupDocs.Parser Live Demos besuchen. Die Live-Demo bietet folgende Vorteile.
Sie müssen die GroupDocs-API nicht herunterladen
Es muss kein Code geschrieben werden
Laden Sie einfach die Quelldatei hoch, um eine sofortige Anzeige zu erhalten
Holen Sie sich den Download-Link, um die Datei auf Ihrem Computer zu speichern
.NET API zum Parsen und Extrahieren von Dokumenten für Dateiformate und Bilder. Extrahieren Sie Daten für einige der gängigen Dateiformate, wie unten aufgeführt.
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)
(Excel Macro-Enabled Add-In)
(Microsoft Excel Spreadsheet (Legacy))