Extraiga imágenes de PDF, DOCX, PPTX, MSG, XLSX documentos y páginas a través de la API de C#.NET

GroupDocs.Parser .NET API permite a los programadores extraer imágenes de PDF, DOC, DOCX, PPT, PPTX, EML, MSG, XLS, XLSX, CSV , ODT, RTF y EPUB documentos o páginas de documentos.


Descargue prueba gratis

¿Cómo extraer imágenes de documentos a través de .NET?

Las imágenes se pueden usar para entregar información de tal manera que no se pueda expresar con palabras. Las imágenes nos ayudan a captar la atención del usuario y explican conceptos difíciles con facilidad. A veces, mientras leíamos documentos, diarios o nos beneficiábamos de presentaciones, a menudo encontrábamos algunas imágenes fascinantes y queríamos descargarlas. GroupDocs.Parser for .NET es una potente API que ayuda a los usuarios a desarrollar aplicaciones útiles para extraer imágenes de diferentes tipos de documentos y guardarlas en PNG, JPEG, WebP, GIF, BMP y otros formatos. La API ha incluido compatibilidad con la extracción de texto e imágenes de algunos de los formatos de archivo más utilizados, como PDF, correos electrónicos, libros electrónicos, Microsoft Office formatos: Word (DOC, DOCX), { 284} (PPT, PPTX), Excel (XLS, XLSX), formatos de LibreOffice y muchos más. La API también es totalmente compatible con el análisis de documentos, la extracción de texto sin formato y estructurado, la búsqueda de texto por palabras clave, la extracción de metadatos o imágenes, contenedores y archivos adjuntos y mucho más.

Extraer imágenes de documentos en .NET

GroupDocs.Parser for .NET facilita a los desarrolladores de C# la extracción de imágenes de un documento mediante la implementación de unos sencillos pasos.

  • Crear una instancia del objeto Parser para el documento inicial;
  • Llame al método GetImages y obtenga una colección de objetos de imagen;
  • Compruebe si el lector no es * nulo * (la extracción de imágenes es compatible con el documento);
  • Iterar a través de la colección y obtener tamaños, tipos de imágenes y contenidos de imágenes.

Cómo extraer imágenes de documentos usando el código de ejemplo C#

// Extrae imágenes de documentos usando la API GroupDocs.Parser
// Crear una instancia de la clase Parser
using (Parser parser = new Parser(filePath)) {
    // Extraer imágenes
    IEnumerable<PageImageArea> images = parser.GetImages();
    // Compruebe si se admite la extracción de imágenes
    if (images == null) {
        Console.WriteLine("La extracción de imágenes no es compatible");
        return;
    }
    // Iterar sobre imágenes
    foreach (PageImageArea image in images) {
        // Imprima un índice de página, un rectángulo y un tipo de imagen:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", image.Page.Index, image.Rectangle, image.FileType));
    }
}

Requisitos del sistema

GroupDocs.Parser for .NET Las API son compatibles con todas las principales plataformas y sistemas operativos. Antes de ejecutar el código a continuación, asegúrese de tener instalados los siguientes requisitos previos en su sistema.

  • Sistemas operativos: Microsoft Windows, Linux, MacOS
  • Entornos de desarrollo: Microsoft Visual Studio, Xamarin, MonoDevelop
  • Marcos
  • Descarga la última versión de GroupDocs.Parser for .NET desde Nuget

Por qué usar GroupDocs.Parser for .NET

  • Compatibilidad con la extracción de texto sin formato de cualquier documento compatible
  • Análisis de documentos a través de plantillas definidas por el usuario
  • Totalmente compatible con la extracción de texto estructurado
  • Búsqueda de texto por palabra clave y expresión regular
  • Extraiga texto formateado, metadatos, imágenes, contenedores y archivos adjuntos
  • Extraiga la tabla de contenido para algunos formatos de documentos compatibles
  • Analizar datos de formulario de PDF documentos
  • Extraer hipervínculos del documento

Demostraciones en vivo: extraiga imágenes de documentos en línea

Extraiga imágenes de documentos ahora mismo visitando el sitio web GroupDocs.Parser Live Demos. La demostración en vivo tiene los siguientes beneficios.

No es necesario descargar la API

No es necesario escribir ningún código

Simplemente cargue el archivo fuente

Obtener enlace de descarga para guardar el archivo

Extraiga imágenes de otros formatos de documentos

.NET API de análisis de documentos y extracción de imágenes para formatos de archivo e imágenes. Extraiga datos para algunos de los formatos de archivo populares como se indica a continuación.

DOC

(Microsoft Word Binary Format)

DOCM

(Microsoft Word 2007 Marco File)

DOCX

(Office 2007+ Word Document)

DOT

(Microsoft Word Template Files)

DOTM

(Microsoft Word 2007+ Template File)

DOTX

(Microsoft Word Template File )

EPUB

(Open eBook File)

HTML

(Hyper Text Markup Language)

MHT

(MHTML Web Archive)

MHTML

(Web Page Archive Format)

ODP

(OpenDocument Presentation Format)

ODS

(OpenDocument Spreadsheet)

ODT

(OpenDocument Text File Format)

ONE

(OneNote Document)

OTP

(OpenDocument Standard Format)

OTT

(OpenDocument Standard Format)

PDF

(Portable Document Format)

Back to top
 Español