GroupDocs.Parser for Java est une API d’extraction de texte, d’image et de métadonnées, prenant en charge plus de 50 types de documents populaires pour aider à créer des applications métier avec des fonctionnalités d’analyse de texte brut, structuré et formaté. Il prend également en charge l’analyse de documents à l’aide de modèles prédéfinis et permet d’extraire des données complexes de factures et d’autres documents typiques avec rapidité et précision. GroupDocs.Parser for Java vous permet d’extraire du texte et des métadonnées à partir de fichiers protégés par mot de passe de tous les formats populaires, y compris les documents de traitement Word, les feuilles de calcul Excel, les présentations PowerPoint, les fichiers OneNote, PDF et les archives ZIP.
GroupDocs.Parser L’API est un bon choix pour les solutions d’entreprise qui nécessitent une fonctionnalité d’extraction de texte de fichier. Ces API sont bien prises en charge sur tous les principaux systèmes d’exploitation et plates-formes, y compris Java runtime: J2SE 6.0 and above.
GroupDocs.Parser for Java permet aux développeurs Java d’extraire facilement un texte de documents en mettant en œuvre quelques étapes simples.
// Extraire du texte de documents à l'aide de l'API GroupDocs.Parser
// Créer une instance de la classe Parser
try (Parser parser = new Parser(filePath)) {
// Extraire un texte dans le lecteur
try (TextReader reader = parser.getText()) {
// Imprimer un texte à partir du document
// Si l'extraction de texte n'est pas prise en charge, un lecteur est nul
System.out.println(reader == null ? "L'extraction de texte n'est pas prise en charge" : reader.readToEnd());
}
}
GroupDocs.Parser for Java Les API sont prises en charge sur toutes les principales plates-formes et systèmes d’exploitation. Avant d’exécuter le code ci-dessous, assurez-vous que les prérequis suivants sont installés sur votre système.
Extrayez le texte des documents dès maintenant en visitant le site Web GroupDocs.Parser Live Demos. La démo en direct présente les avantages suivants.
Pas besoin de télécharger l'API
Pas besoin d'écrire de code
Téléchargez simplement le fichier source
Obtenir le lien de téléchargement pour enregistrer le fichier
API d’analyse de documents et d’extraction de texte Java pour les formats de fichiers et les images. Extrayez les données pour certains des formats de fichiers populaires comme indiqué ci-dessous.
(Microsoft Word Binary Format)
(Microsoft Word 2007 Marco File)
(Office 2007+ Word Document)
(Microsoft Word Template Files)
(Microsoft Word 2007+ Template File)
(Microsoft Word Template File )
(Open eBook File)
(Hyper Text Markup Language)
(MHTML Web Archive)
(Web Page Archive Format)
(OpenDocument Presentation Format)
(OpenDocument Spreadsheet)
(OpenDocument Text File Format)
(OneNote Document)
(OpenDocument Standard Format)
(OpenDocument Standard Format)
(Portable Document Format)