GroupDocs.Parser for .NET

استخراج جداول از PDF با استفاده از C#

به سرعت ساختارهای جدول را از PDF، Word، Excel و سایر فرمت‌های فایل با استفاده از GroupDocs.Parser در پروژه‌های .NET خود شناسایی و استخراج کنید.

مراحل استخراج جداول از Pdf در C#

برای استخراج جداول از فایل‌های PDF با استفاده از GroupDocs.Parser در محیط .NET خود این دستورالعمل‌ها را دنبال کنید:

  1. یک نمونه Parser را مقداردهی اولیه کرده و سند PDF خود را بارگذاری کنید.
  2. بررسی کنید که آیا استخراج جدول برای فرمت ورودی پشتیبانی می‌شود.
  3. محتوای جدول را از فایل استخراج کنید.
  4. از داده‌های جدول ساختاری برای گزارش‌دهی، اتوماسیون یا آنالیز استفاده کنید.
// مدرکی که شامل داده‌های جدول است را با استفاده از Parser باز کنید
using (Parser parser = new Parser("input.pdf")) {

    // بررسی کنید که آیا فرمت از شناسایی جدول پشتیبانی می‌کند
    if (!parser.Features.Tables) {
        Console.WriteLine("مدارک را مدیریت کنید که از تجزیه جدول پشتیبانی نمی‌کنند");
        return;
    }

    // تعریف کنید که چگونه ساختار جدول شناسایی شود
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // پارامترهای استخراج برای داده‌های جدول را مشخص کنید
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  جداول را از محتوای فایل استخراج کنید
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  در هر جدول شناسایی شده حلقه بزنید
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
برای کپی کلیک کنید
کپی شد
نمونه‌های بیشتر مستندات

قابلیت‌های قدرتمند استخراج داده

علاوه بر تجزیه جدول، GroupDocs.Parser می‌تواند محتوای غنی مانند بلوک‌های متنی، تصاویر، متاداده و سایر داده‌های ساختاری را برای تسهیل در اتوماسیون اسناد استخراج کند.

شناسایی جدول و استخراج محتوا

تشخیص دقیق جدول در چند فرمت

داده‌های جدولی را از DOCX، XLSX، PDF، HTML و فرمت‌های مشابه با دقت بالا استخراج کنید.

تجزیه ساختارهای جدول از فایل‌ها

با دقت داده‌های جدول را از اسناد و صفحات گسترده بدون از دست دادن فرمت بازیابی کنید.

پیکربندی سفارشی استخراج جدول

تشخیص چیدمان، تراز ستون‌ها و گزینه‌های سرصفحه/پاورقی را برای کنترل دقیق خروجی تنظیم کنید.

چگونه جداول را از صفحات گسترده Excel استخراج کنیم

این نمونه کد نشان می‌دهد که چگونه می‌توان داده‌های جدول را در یک فایل XLSX با استفاده از GroupDocs.Parser خواند و به آنها دسترسی پیدا کرد.

C#

//  فایل Excel را با استفاده از API Parser باز کنید
using (Parser parser = new Parser("input.xlsx"))
{
    // اگر نمی‌توان جداول را از فایل استخراج کرد خارج شوید
    if (!parser.Features.Tables)
    {
        return;
    }

    // از قوانین چیدمان برای مکان‌یابی محتویات جدولی استفاده کنید
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // پارامترهای استخراج برای جداول را تنظیم کنید
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // عملیات استخراج جدول را انجام دهید
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // در هر ساختار جدول شناسایی شده بروید
    foreach (PageTableArea t in tables)
    {
        // در هر ردیف جدول حلقه بزنید
        for (int row = 0; row < t.RowCount; row++)
        {
            // در سلول‌های هر ردیف حلقه بزنید
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // به سلول فعلی جدول دسترسی پیدا کنید
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // محتوای متنی هر سلول را نمایش دهید
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

درباره API GroupDocs.Parser for .NET

GroupDocs.Parser یک API جامع برای تجزیه اسناد است که برای توسعه‌دهندگان .NET ساخته شده است. این API امکان استخراج دقیق متن، جداول، تصاویر، پیوندهای هایپر و سایر عناصر ساختاری را از فرمت‌هایی مانند PDF، DOCX، XLSX، PPTX و بسیاری دیگر فراهم می‌کند — بدون نیاز به نرم‌افزارهای ثالث.
بیشتر بدانید
About illustration

برای شروع آماده اید؟

GroupDocs.Parser را به صورت رایگان دانلود کنید یا یک مجوز آزمایشی برای دسترسی کامل دریافت کنید!

منابع مفید

برای ارتقاء تجربه خود ، مستندات ، نمونه های کد و پشتیبانی جامعه را کاوش کنید.

فرمت‌های پشتیبانی شده برای استخراج جدول

GroupDocs.Parser می‌تواند داده‌های جدول را از انواع مختلف فایل‌ها استخراج کند. در زیر فرمت‌های پرکاربرد برای تجزیه جدول‌های ساختاری آمده است.

نکات مجوز موقت

1
با ایمیل کاری خود ثبت نام کنید. خدمات پست الکترونیکی رایگان مجاز نیستند.
2
در مرحله دوم از دکمه دریافت مجوز موقت استفاده کنید.
 فارسی