GroupDocs.Parser for Java ist eine Text-, Bild- und Metadaten-Extraktor-API, die mehr als 50 gängige Dokumenttypen unterstützt, um die Erstellung von Geschäftsanwendungen mit Funktionen zum Parsen von rohem, strukturiertem und formatiertem Text zu unterstützen. Es unterstützt auch das Parsen von Dokumenten mithilfe vordefinierter Vorlagen und ermöglicht das schnelle und genaue Extrahieren komplexer Daten aus Rechnungen und anderen typischen Dokumenten. Mit GroupDocs.Parser for Java können Sie Text und Metadaten aus passwortgeschützten Dateien aller gängigen Formate extrahieren, einschließlich Word Verarbeitungsdokumenten, Excel Tabellenkalkulationen, PowerPoint Präsentationen, OneNote, PDF Dateien und ZIP Archiven.
Die GroupDocs.Parser API ist die richtige Wahl für Unternehmenslösungen, die eine Funktion zum Extrahieren von Dateitext benötigen. Diese APIs werden auf allen wichtigen Betriebssystemen und Plattformen, einschließlich Java runtime: J2SE 6.0 and above, gut unterstützt.
GroupDocs.Parser for Java erleichtert Java-Entwicklern das Extrahieren eines Textes aus einer ODT-Datei durch die Implementierung einiger einfacher Schritte.
// Extrahieren Sie Text aus der Datei ODT mit der API GroupDocs.Parser
// Erstellen Sie eine Instanz der Parser-Klasse
try (Parser parser = new Parser(filePath)) {
// Extrahieren Sie einen Text in den Reader
try (TextReader reader = parser.getText()) {
// Drucken Sie einen Text aus dem Dokument
// Wenn die Textextraktion nicht unterstützt wird, ist ein Leser null
System.out.println(reader == null ? "Textextraktion wird nicht unterstützt" : reader.readToEnd());
}
}
GroupDocs.Parser for Java APIs werden auf allen wichtigen Plattformen und Betriebssystemen unterstützt. Bevor Sie den folgenden Code ausführen, stellen Sie bitte sicher, dass die folgenden Voraussetzungen auf Ihrem System installiert sind.
Extrahieren Sie jetzt Text aus der Datei ODT, indem Sie die Website GroupDocs.Parser Live Demos besuchen. Die Live-Demo bietet folgende Vorteile.
Sie müssen die GroupDocs-API nicht herunterladen
Es muss kein Code geschrieben werden
Laden Sie einfach die Quelldatei hoch, um eine sofortige Anzeige zu erhalten
Holen Sie sich den Download-Link, um die Datei auf Ihrem Computer zu speichern
Java API zum Parsen und Extrahieren von Dokumenten für Dateiformate und Bilder. Extrahieren Sie Daten für einige der gängigen Dateiformate, wie unten aufgeführt.
(OpenDocument Standard Format)
(OpenDocument Standard Format)
(Portable Document Format)
(PowerPoint Slide Show)
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)