GroupDocs.Parser pour .NET est une API d’extraction de texte, de métadonnées et d’images pour les applications métier développées à l’aide de C#, ASP.NET et d’autres technologies .NET. Il prend en charge l’extraction de texte brut, formaté et structuré ainsi que les métadonnées des fichiers de formats pris en charge. Grâce à GroupDocs.Parser pour .NET, vos applications peuvent également effectuer l’analyse de documents protégés par mot de passe pour les formats courants, tels que les documents de traitement de texte, les feuilles de calcul Excel, les présentations PowerPoint, OneNote, les fichiers PDF et les archives ZIP.
Compter statistiquement l’occurrence de mots dans des fichiers uniques ou multiples
Extraire du texte et des métadonnées à partir de feuilles de calcul Excel et de modèles de présentation
Extraire le contenu textuel d’un fichier ou d’un flux sans installer Document Reader
Get Formatted Text from a Document using Fast or Standard Extraction de texte Mode
Détecter le type de support des documents XML protégés par mot de passe et en extraire le texte
Obtenir par programme du texte formaté à partir d’e-mails et de pièces jointes
Extraire du texte à partir d’une ou plusieurs pages d’un document OneNote
Extraire des données à partir de documents PDF, MS Word, Excel et de présentation
Extraire des données des formulaires PDF et extraire du texte d’un fichier PDF simple ou d’un document de portefeuille PDF
Obtenir du texte formaté à partir d’une présentation PowerPoint ou chasser du texte à partir d’une diapositive spécifique
Rassemblez du texte brut ou formaté à partir de cellules, de lignes et de colonnes à partir d’une feuille de calcul Excel
Extraire du texte au format brut ou HTML à partir d’un document Word
Le formateur HTML prend en charge le formatage des paragraphes, des liens hypertexte, des polices, des en-têtes, des listes et des tableaux
Extraction d’une seule phrase ou d’un texte entier à partir de fichiers EPUB, CHM, Markdown et FB2
Extrait de la table des matières des bases de données, PDF, EPUB, CHM et documents de traitement de texte
Extrayez le texte avec sa structure de contenu intacte et extrayez le texte en surbrillance des documents
Obtenir une zone de texte à partir de documents pour analyse et extraire des métadonnées à partir de formats de document pris en charge
Obtenir toutes les images ou une sélection d’images à partir des formats pris en charge et faire pivoter les images extraites
Extraire le texte des fichiers dans les archives Zip et les conteneurs OST et détecter les types de fichiers des éléments de conteneur ZIP
Obtenir des données à partir du conteneur de messagerie (serveur Web Exchange, POP3, IMAP)
Rechercher du texte simple, des mots entiers et des expressions régulières dans les documents
Préparer le modèle de document, extraire les données du document et analyser les champs et les tableaux de données
Rechercher et extraire des expressions en surbrillance dans des documents
Obtenir du texte avec le formateur de texte brut (simple et ASCII) ou avec Markdown Formatter
Markdown Formatter prend en charge le formatage de la police, des hyperliens, des en-têtes, des listes et des tableaux
Effectuer un formatage personnalisé avec des bords, des angles et des intersections pour formater du texte brut
Déplacer la disposition du tableau et détecter les tableaux dans une zone rectangulaire par des séparateurs de colonnes
Extraire du texte à partir de formes, d’objets WordArt et de zones de texte dans les formats de fichier Microsoft Office
Extraire des images dans des fichiers - Enregistrer aux formats JPG, PNG, GIF, BMP, PNG ou WEBP