.NET API pour extraire les données de document

Extrayez des images, du texte brut ou formaté et des métadonnées de documents, feuilles de calcul, présentations, e-mails et archives à partir d’applications .NET.


Télécharger la version d'essai gratuite

GroupDocs.Parser pour .NET est une API d’extraction de texte, de métadonnées et d’images pour les applications métier développées à l’aide de C#, ASP.NET et d’autres technologies .NET. Il prend en charge l’extraction de texte brut, formaté et structuré ainsi que les métadonnées des fichiers de formats pris en charge. Grâce à GroupDocs.Parser pour .NET, vos applications peuvent également effectuer l’analyse de documents protégés par mot de passe pour les formats courants, tels que les documents de traitement de texte, les feuilles de calcul Excel, les présentations PowerPoint, OneNote, les fichiers PDF et les archives ZIP.

GroupDocs.Parser for .NET Caractéristiques

Compter statistiquement l’occurrence de mots dans des fichiers uniques ou multiples

Extraire du texte et des métadonnées à partir de feuilles de calcul Excel et de modèles de présentation

Extraire le contenu textuel d’un fichier ou d’un flux sans installer Document Reader

Get Formatted Text from a Document using Fast or Standard Extraction de texte Mode

Détecter le type de support des documents XML protégés par mot de passe et en extraire le texte

Obtenir par programme du texte formaté à partir d’e-mails et de pièces jointes

Extraire du texte à partir d’une ou plusieurs pages d’un document OneNote

Extraire des données à partir de documents PDF, MS Word, Excel et de présentation

Extraire des données des formulaires PDF et extraire du texte d’un fichier PDF simple ou d’un document de portefeuille PDF

Obtenir du texte formaté à partir d’une présentation PowerPoint ou chasser du texte à partir d’une diapositive spécifique

Rassemblez du texte brut ou formaté à partir de cellules, de lignes et de colonnes à partir d’une feuille de calcul Excel

Extraire du texte au format brut ou HTML à partir d’un document Word

Le formateur HTML prend en charge le formatage des paragraphes, des liens hypertexte, des polices, des en-têtes, des listes et des tableaux

Extraction d’une seule phrase ou d’un texte entier à partir de fichiers EPUB, CHM, Markdown et FB2

Extrait de la table des matières des bases de données, PDF, EPUB, CHM et documents de traitement de texte

Extrayez le texte avec sa structure de contenu intacte et extrayez le texte en surbrillance des documents

Obtenir une zone de texte à partir de documents pour analyse et extraire des métadonnées à partir de formats de document pris en charge

Obtenir toutes les images ou une sélection d’images à partir des formats pris en charge et faire pivoter les images extraites

Extraire le texte des fichiers dans les archives Zip et les conteneurs OST et détecter les types de fichiers des éléments de conteneur ZIP

Obtenir des données à partir du conteneur de messagerie (serveur Web Exchange, POP3, IMAP)

Rechercher du texte simple, des mots entiers et des expressions régulières dans les documents

Préparer le modèle de document, extraire les données du document et analyser les champs et les tableaux de données

Rechercher et extraire des expressions en surbrillance dans des documents

Obtenir du texte avec le formateur de texte brut (simple et ASCII) ou avec Markdown Formatter

Markdown Formatter prend en charge le formatage de la police, des hyperliens, des en-têtes, des listes et des tableaux

Effectuer un formatage personnalisé avec des bords, des angles et des intersections pour formater du texte brut

Déplacer la disposition du tableau et détecter les tableaux dans une zone rectangulaire par des séparateurs de colonnes

Extraire du texte à partir de formes, d’objets WordArt et de zones de texte dans les formats de fichier Microsoft Office

Extraire des images dans des fichiers - Enregistrer aux formats JPG, PNG, GIF, BMP, PNG ou WEBP

Ressources d'assistance et d'apprentissage

GroupDocs.Parser propose des API de visualisation de documents pour d’autres environnements de développement populaires

Back to top
Fr