GroupDocs.Parser for .NET est une API d’extraction de texte, de métadonnées et d’images pour les applications métier développées à l’aide de C#, ASP.NET et d’autres technologies .NET. Il prend en charge l’extraction de texte brut, formaté et structuré ainsi que les métadonnées des fichiers de formats pris en charge. Grâce à GroupDocs.Parser for .NET, vos applications peuvent également effectuer l’analyse de documents protégés par mot de passe pour les formats courants, tels que les documents de traitement Word, les feuilles de calcul Excel, les présentations PowerPoint, les fichiers OneNote, les fichiers PDF et les archives ZIP .
GroupDocs.Parser L’API est un bon choix pour les solutions d’entreprise qui nécessitent une fonctionnalité d’extraction de texte de fichier. Ces API sont bien prises en charge sur tous les principaux systèmes d’exploitation et plates-formes, y compris Frameworks: .NET Framework, .NET Standard, .NET Core, Mono.
GroupDocs.Parser for .NET permet aux développeurs C# d’extraire facilement un texte d’un fichier PDF en mettant en œuvre quelques étapes simples.
// Extraire le texte du fichier PDF à l'aide de l'API GroupDocs.Parser
// Créer une instance de la classe Parser
using (Parser parser = new Parser(filePath)) {
// Extraire un texte dans le lecteur
using (TextReader reader = parser.GetText()) {
// Imprimer un texte à partir du document
// Si l'extraction de texte n'est pas prise en charge, un lecteur est nul
Console.WriteLine(reader == null ? "L'extraction de texte n'est pas prise en charge" : reader.ReadToEnd());
}
}
GroupDocs.Parser for .NET Les API sont prises en charge sur toutes les principales plates-formes et systèmes d’exploitation. Avant d’exécuter le code ci-dessous, assurez-vous que les prérequis suivants sont installés sur votre système.
Extrayez le texte du fichier PDF dès maintenant en visitant le site Web GroupDocs.Parser Live Demos. La démo en direct présente les avantages suivants.
Pas besoin de télécharger l'API
Pas besoin d'écrire de code
Téléchargez simplement le fichier source
Obtenir le lien de téléchargement pour enregistrer le fichier
API d’analyse de documents et d’extraction de texte .NET pour les formats de fichiers et les images. Extrayez les données pour certains des formats de fichiers populaires comme indiqué ci-dessous.
(PowerPoint Slide Show)
(Microsoft PowerPoint 97-2003)
(Open XML presentation Format)
(Rich Text Format)
(LaTeX Source Document)
(The 7th Guest Video File)
(Visio Macro-Enabled Drawing)
(Visio Drawing)
(Visio Macro-Enabled Stencil File)
(Visio Stencil File)
(Visio Macro-Enabled Drawing Template)
(Visio Drawing Template)
(Visio Stencil XML File)
(Anim8or 3D Model)
(Excel Macro-Enabled Add-In)
(Microsoft Excel Spreadsheet (Legacy))