GroupDocs.Parser für Java ist eine Text-, Bild- und Metadaten-Extraktions-API, die mehr als 50 gängige Dokumenttypen unterstützt, um die Erstellung von Geschäftsanwendungen mit Funktionen zum Analysieren von rohem, strukturiertem und formatiertem Text zu unterstützen. Es unterstützt auch das Parsen von Dokumenten mit vordefinierten Vorlagen und ermöglicht das schnelle und genaue Extrahieren komplexer Daten aus Rechnungen und anderen typischen Dokumenten. Mit GroupDocs.Parser für Java können Sie Text und Metadaten aus passwortgeschützten Dateien aller gängigen Formate extrahieren, darunter Textverarbeitungsdokumente, Excel-Tabellen, PowerPoint-Präsentationen, OneNote, PDF-Dateien und ZIP-Archive.
Mit GroupDocs.Parser für Java können Sie verschiedene Formatierer auf Text und HTML anwenden. Sie können Text mit Plain Text Formatter sowohl für Einfach als auch für ASCII abrufen. Sie können auch Text mit HTML-Formatierer abrufen und Formatierungen auf Absätze, Hyperlinks, Schriftarten, Überschriften, Listen und Tabellen anwenden.