GroupDocs.Parser en un coup d’œil
SDK d’analyseur de documents pour effectuer une analyse de documents à haute précision dans les applications Python
Extraire des données depuis les documents
GroupDocs.Parser for Python via .NET API vous permet de récupérer le texte, les métadonnées et les images d’un large éventail de formats de fichiers tels que les documents Office, les e‑mails, les pièces jointes et les archives. Cet outil puissant vous aide à accéder et à traiter efficacement les informations précieuses contenues dans ces fichiers pour diverses applications comme l’analyse de données, l’indexation de moteurs de recherche ou les systèmes de gestion de contenu.
Analyser les documents
Extrayez divers éléments tels que les hyperliens, les tableaux, les QR codes, les codes-barres et les données des formulaires PDF. Analysez également toute information souhaitée à partir de documents en utilisant des modèles personnalisés.
Personnaliser les résultats
Python API vous permet de récupérer des données dans divers formats tels que brut, structuré, HTML ou Markdown. De plus, l’API propose une fonctionnalité de recherche pour localiser des mots ou des expressions spécifiques dans le texte des documents.

