GroupDocs.Parser for Java

دریافت داده‌های جدولی از XLSX با استفاده از Java

به‌راحتی جداول را از فرمت‌هایی مانند PDF، DOCX و XLSX با GroupDocs.Parser در جریان‌های کاری Java خود تشخیص داده و استخراج کنید.

چگونه جداول را از Xlsx در Java استخراج کنیم

برای استخراج جداول از اسناد XLSX با استفاده از GroupDocs.Parser، مراحل زیر را در محیط Java خود دنبال کنید:

  1. یک نمونه از Parser را ایجاد کرده و فایل هدف XLSX را بارگذاری کنید.
  2. تأیید کنید که فایل از استخراج جدول ساختار‌یافته پشتیبانی می‌کند.
  3. از API برای استخراج المان‌های جدول از سند استفاده کنید.
  4. از داده‌های استخراج‌شده در تحلیل، گزارش‌گیری یا سیستم‌های اتوماسیون استفاده کنید.
// بارگذاری سند ورودی با Parser که شامل المان‌های جدول است.
try (Parser parser = new Parser("input.xlsx"))
{
    // تأیید کنید که نوع سند اجازه شناسایی جدول را می‌دهد.
    if (!parser.getFeatures().isTables()) {
        System.out.println("منطق لازم برای فایل‌هایی که از جداول پشتیبانی نمی‌کنند را اضافه کنید.");
        return;
    }

    // قوانینی برای تفسیر ساختار جدول تعریف کنید.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // پارامترهایی برای استخراج جداول تنظیم کنید.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  عملیات استخراج جدول را بر روی سند بارگذاری‌شده اجرا کنید.
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  هر جدول استخراج‌شده را از نتیجه پردازش کنید.
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
برای کپی کلیک کنید
کپی شد
نمونه‌های بیشتر مستندات

ابزارهای پیشرفته استخراج محتوا

فراتر از خواندن جداول، GroupDocs.Parser از ثبت متن ساده، عناصر بصری، متادیتای شما و اشیای ساختار‌یافته برای بهبود وظایف پردازش سند پشتیبانی می‌کند.

استخراج محتوای ساختار‌یافته و داده‌های جدولی

تجزیه دقیق جدول در فرمت‌های مختلف

پشتیبانی از استخراج جداول از انواع مستندات استاندارد مانند PDF، Word، Excel و HTML با دقت بالا.

خواندن ساختارهای جدولی از منابع مختلف

استخراج داده‌های جدول از صفحات گسترده، اسناد و گزارش‌ها در حالی که ساختار و تراز را حفظ می‌کند.

تنظیمات استخراج جدول قابل تنظیم

تشخیص لایه، مدیریت سرصفحات و پاورقی‌ها و تنظیم دقیق استخراج با گزینه‌های پیکربندی منعطف.

نمونه: استخراج جداول از یک سند Excel

این مثال نشان می‌دهد که چگونه می‌توان محتویات جدول را در یک فایل Excel (XLSX) با استفاده از GroupDocs.Parser استخراج و مرور کرد.

Java

//  مقداردهی اولیه Parser با فایل Excel.
try (Parser parser = new Parser("input.pdf"))
{
    // در صورتی که استخراج جدول برای این سند پشتیبانی نشود، خارج شوید.
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // قوانینی برای یافتن لایه جدول اعمال کنید.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // تنظیمات را برای استخراج جدول پیکربندی کنید.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // فرآیند استخراج را فراخوانی کنید.
    Iterable<PageTableArea> tables = parser.getTables(options);

    // بر روی تمام ساختارهای جدول تجزیه شده مرور کنید.
    for (PageTableArea t : tables)
    {
        // بر روی هر ردیف در جدول تکرار کنید.
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // هر سلول در ردیف فعلی را پردازش کنید.
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // به محتوای سلول فعلی دسترسی پیدا کرده و آن را بخوانید.
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // مقدار متنی هر سلول جدول را خروجی دهید.
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

معرفی API GroupDocs.Parser for Java

GroupDocs.Parser یک API استخراج محتوای غنی برای پلتفرم‌های Java است. این ابزار به توسعه‌دهندگان اجازه می‌دهد تا به‌دقت جداول، متن، گرافیک، لینک‌ها و داده‌های ساختار‌یافته را از PDFها، اسناد Word، صفحات Excel، ارائه‌های PowerPoint و بیشتر استخراج کنند—بدون نیاز به پلاگین‌های شخص ثالث.
بیشتر بدانید
About illustration

برای شروع آماده اید؟

GroupDocs.Parser را به صورت رایگان دانلود کنید یا یک مجوز آزمایشی برای دسترسی کامل دریافت کنید!

منابع مفید

برای ارتقاء تجربه خود ، مستندات ، نمونه های کد و پشتیبانی جامعه را کاوش کنید.

انواع اسناد پشتیبانی شده برای استخراج جداول

GroupDocs.Parser تشخیص جدول مطمئن را در چندین نوع فایل ارائه می‌دهد. در اینجا فهرستی از قالب‌های مستندات به‌طور گسترده‌ای پشتیبانی شده برای استخراج جداول آورده شده است.

نکات مجوز موقت

1
با ایمیل کاری خود ثبت نام کنید. خدمات پست الکترونیکی رایگان مجاز نیستند.
2
در مرحله دوم از دکمه دریافت مجوز موقت استفاده کنید.
 فارسی