Parser pour Net

SDK d’analyse de documents pour .NET

Ajoutez une analyse de documents rapide et précise à vos applications .NET et extrayez le texte, les images, les métadonnées et les données structurées à partir de documents et d’images.

Télécharger NuGet Commencer l'essai gratuit

Version 26.6.1 publiée

Voir les nouveautés

// Transmettez le fichier source à l'instance Parser
using (var parser = new Parser("source.pdf"))
{
    // Transmettez le texte du document à TextReader
    using (var textReader = parser.GetText())
    {
        // Traitez le texte du document
        Console.WriteLine(textReader?.ReadToEnd());
    }
}

dotnet add package GroupDocs.Parser

GroupDocs.Parser en un coup d’œil

SDK d’analyse de documents pour réaliser une analyse de documents haute précision dans les applications .NET

Extraire des données à partir de documents

GroupDocs.Parser for .NET API vous permet de récupérer le texte, les métadonnées et les images d’un large éventail de formats de fichiers tels que les documents Office, les e‑mails, les pièces jointes et les archives. Cet outil puissant vous aide à accéder et à traiter efficacement les informations précieuses contenues dans ces fichiers pour diverses applications comme l’analyse de données, l’indexation de moteurs de recherche ou les systèmes de gestion de contenu.

Analyser des documents

Extrayez divers éléments tels que les hyperliens, les tableaux, les QR codes, les codes-barres et les données des formulaires PDF. Analysez également toute information souhaitée à partir de documents à l’aide de modèles personnalisés.

Personnaliser les résultats

L’API .NET vous permet de récupérer des données dans divers formats tels que brut, structuré, HTML ou Markdown. De plus, l’API offre une fonctionnalité de recherche pour localiser des mots ou des phrases spécifiques dans le texte des documents.

Indépendance de plateforme

GroupDocs.Parser for .NET prend en charge les systèmes d’exploitation, les frameworks et les gestionnaires de packages suivants

Formats de fichiers pris en charge

GroupDocs.Parser for .NET prend en charge les opérations avec les formats de fichiers suivants.

Formats Microsoft Office

Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

Images et autres formats

Portable: PDF
Images: JPG, BMP, PNG, TIFF, GIF
Autres formats Office: ODT, OTT, OTS, ODS, ODP, OTP, ODG

Autres formats

Web: HTML, MHTML
Archives: ZIP, TAR, 7Z
e-books: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET fonctionnalités

Extrayez des données des PDF, des documents Office, des images et d’autres formats rapidement et avec précision grâce à notre SDK d’analyse de documents .NET

Extraire du texte

Extrayez les informations textuelles de divers formats de fichiers tels que les documents Office, les fichiers PDF et les images pour une lecture et une analyse aisées.

Extraire des images

Récupérez le contenu visuel de diverses sources comme les documents Office ou les fichiers PDF pour un accès et une utilisation pratiques.

Scanner les QR Codes

Détectez et décodez les QR codes présents dans les documents Office, les fichiers PDF ou le contenu visuel pour une récupération d’informations efficace.

Extraire des données des pièces jointes d’e‑mail et des archives

Recueillez des informations précieuses à partir des messages électroniques, des pièces jointes et des sources de données compressées pour une analyse et une utilisation efficaces.

Extraire les tableaux

Identifiez et extrayez les données tabulaires des documents PDF pour une analyse et une utilisation organisées.

Extraire les hyperliens

Localisez et extrayez les hyperliens et les adresses e‑mail dans les documents Office ou les fichiers PDF pour un accès efficace.

Analyser les formulaires PDF

Les formulaires PDF sont des documents numériques contenant des champs remplissables pour l’interaction utilisateur, permettant de saisir des informations électroniquement. L’API .NET peut être utilisée pour extraire les données de ces formulaires afin de les traiter efficacement.

Analyser les données à l’aide de modèles

Créez des modèles personnalisés et utilisez‑les avec l’API .NET pour analyser des informations spécifiques à partir de fichiers PDF, simplifiant ainsi les processus d’extraction de données.

Rechercher du texte dans les documents

Localisez rapidement des mots ou des motifs spécifiques dans les documents.

Exemples de code

Quelques cas d’utilisation typiques des opérations GroupDocs.Parser for .NET

Extraire des images de documents PDF

GroupDocs.Parser for .NET facilite l’extraction

d’images par les développeurs C# à partir des documents :

Extraire des images de documents PDF en C#

// Créez une instance de la classe Parser style=color:#00f>using (var parser = new Parser("source.pptx")) { // Extrayez les images var images = parser.GetImages(); // Vérifiez si quelque chose a été extrait if (images == null) { return; } // Itérez sur les images foreach (PageImageArea image in images) { // Affichez l'index de page, le rectangle et le type d'image Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType)); } }

`Extraire les codes-barres à partir d’images`

Utilisez notre API .NET pour extraire les codes‑barres à partir d’images :

`Extraire les codes-barres d'images en C#`

// Chargez l'image source dans Parser
using (var parser = new Parser("source.jpg"))
{
    // Vérifiez si le fichier prend en charge l'extraction de codes-barres
    if (parser.Features.Barcodes)
    {
        // Extrayez les codes-barres du fichier
        var barcodes = parser.GetBarcodes();

        // Itérez sur les codes-barres
        foreach (var barcode in barcodes)
        {
            // Affichez l'index de page
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // Affichez la valeur du code-barres
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

`Prêt à commencer ?`

Téléchargez GroupDocs.Parser gratuitement ou obtenez une licence d’essai pour un accès complet !

Télécharger NuGet
Commencer l'essai gratuit

`Ressources utiles`

Explorez la documentation, les échantillons de code et le soutien communautaire pour améliorer votre expérience.


Documentation
Référence de l’API
Échantillons de code
Support gratuit
Assistance payante