GroupDocs.Parser for Java

دریافت داده‌های جدولی از XLSX با استفاده از Java

به‌راحتی جداول را از فرمت‌هایی مانند PDF، DOCX و XLSX با GroupDocs.Parser در جریان‌های کاری Java خود تشخیص داده و استخراج کنید.

Maven دانلود

آزمایش رایگان را شروع کنید

چگونه جداول را از Xlsx در Java استخراج کنیم

برای استخراج جداول از اسناد XLSX با استفاده از GroupDocs.Parser، مراحل زیر را در محیط Java خود دنبال کنید:

یک نمونه از Parser را ایجاد کرده و فایل هدف XLSX را بارگذاری کنید.
تأیید کنید که فایل از استخراج جدول ساختار‌یافته پشتیبانی می‌کند.
از API برای استخراج المان‌های جدول از سند استفاده کنید.
از داده‌های استخراج‌شده در تحلیل، گزارش‌گیری یا سیستم‌های اتوماسیون استفاده کنید.

کپی

// بارگذاری سند ورودی با Parser که شامل المان‌های جدول است.
try (Parser parser = new Parser("input.xlsx"))
{
    // تأیید کنید که نوع سند اجازه شناسایی جدول را می‌دهد.
    if (!parser.getFeatures().isTables()) {
        System.out.println("منطق لازم برای فایل‌هایی که از جداول پشتیبانی نمی‌کنند را اضافه کنید.");
        return;
    }

    // قوانینی برای تفسیر ساختار جدول تعریف کنید.
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // پارامترهایی برای استخراج جداول تنظیم کنید.
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  عملیات استخراج جدول را بر روی سند بارگذاری‌شده اجرا کنید.
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  هر جدول استخراج‌شده را از نتیجه پردازش کنید.
    for (PageTableArea t : tables) 
    {
    }
}

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>24.9</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://repository.groupdocs.com/repo/</url>
</repository>
</repositories>

برای کپی کلیک کنید

کپی شد

نمونه‌های بیشتر مستندات

ابزارهای پیشرفته استخراج محتوا

فراتر از خواندن جداول، GroupDocs.Parser از ثبت متن ساده، عناصر بصری، متادیتای شما و اشیای ساختار‌یافته برای بهبود وظایف پردازش سند پشتیبانی می‌کند.

استخراج محتوای ساختار‌یافته و داده‌های جدولی

تجزیه دقیق جدول در فرمت‌های مختلف

پشتیبانی از استخراج جداول از انواع مستندات استاندارد مانند PDF، Word، Excel و HTML با دقت بالا.

خواندن ساختارهای جدولی از منابع مختلف

استخراج داده‌های جدول از صفحات گسترده، اسناد و گزارش‌ها در حالی که ساختار و تراز را حفظ می‌کند.

تنظیمات استخراج جدول قابل تنظیم

تشخیص لایه، مدیریت سرصفحات و پاورقی‌ها و تنظیم دقیق استخراج با گزینه‌های پیکربندی منعطف.

نمونه: استخراج جداول از یک سند Excel

این مثال نشان می‌دهد

که چگونه می‌توان محتویات جدول را در یک فایل Excel (XLSX) با استفاده از GroupDocs.Parser استخراج و مرور کرد.

Java

//  مقداردهی اولیه Parser با فایل Excel. style=color:#888;font-style:italic>try (Parser parser = new Parser("input.pdf")) { // در صورتی که استخراج جدول برای این سند پشتیبانی نشود، خارج شوید. style=color:#888;font-style:italic>    if (!parser.getFeatures().isTables()) { return; } // قوانینی برای یافتن لایه جدول اعمال کنید. style=color:#888;font-style:italic>    TemplateTableLayout layout = new TemplateTableLayout( java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}), java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0})); // تنظیمات را برای استخراج جدول پیکربندی کنید. style=color:#888;font-style:italic>    PageTableAreaOptions options = new PageTableAreaOptions(layout); // فرآیند استخراج را فراخوانی کنید. style=color:#888;font-style:italic>    Iterable<PageTableArea> tables = parser.getTables(options); // بر روی تمام ساختارهای جدول تجزیه شده مرور کنید. style=color:#888;font-style:italic>    for (PageTableArea t : tables) { // بر روی هر ردیف در جدول تکرار کنید. style=color:#888;font-style:italic>        for (int row = 0; row < t.getRowCount(); row++) { // هر سلول در ردیف فعلی را پردازش کنید. style=color:#888;font-style:italic>            for (int column = 0; column < t.getColumnCount(); column++) { // به محتوای سلول فعلی دسترسی پیدا کرده و آن را بخوانید. style=color:#888;font-style:italic>                PageTableAreaCell cell = t.getCell(row, column); if (cell != null) { // مقدار متنی هر سلول جدول را خروجی دهید. style=color:#888;font-style:italic>                    System.out.print(cell.getText()); System.out.print(" | "); } } } } }

`معرفی API GroupDocs.Parser for Java`

GroupDocs.Parser یک API استخراج محتوای غنی برای پلتفرم‌های Java است. این ابزار به توسعه‌دهندگان اجازه می‌دهد تا به‌دقت جداول، متن، گرافیک، لینک‌ها و داده‌های ساختار‌یافته را از PDFها، اسناد Word، صفحات Excel، ارائه‌های PowerPoint و بیشتر استخراج کنند—بدون نیاز به پلاگین‌های شخص ثالث.

بیشتر بدانید

`برای شروع آماده اید؟`

GroupDocs.Parser را به صورت رایگان دانلود کنید یا یک مجوز آزمایشی برای دسترسی کامل دریافت کنید!

Maven دانلود
آزمایش رایگان را شروع کنید

`منابع مفید`

برای ارتقاء تجربه خود ، مستندات ، نمونه های کد و پشتیبانی جامعه را کاوش کنید.


مستند سازی
مرجع API
نمونه کد
پشتیبانی رایگان
پشتیبانی پرداخت شده

`انواع اسناد پشتیبانی شده برای استخراج جداول`

GroupDocs.Parser تشخیص جدول مطمئن را در چندین نوع فایل ارائه می‌دهد. در اینجا فهرستی از قالب‌های مستندات به‌طور گسترده‌ای پشتیبانی شده برای استخراج جداول آورده شده است.

تحلیل PDF(فرمت سند قابل حمل)
تحلیل DOCX(سند Word Office 2007+)
تحلیل PPTX(فرمت ارائه Open XML)
تحلیل TXT(فایل متنی)
تحلیل RTF(فرمت متن غنی)
تحلیل XML(زبان نشانه‌گذاری قابل توسعه)
تحلیل EPUB(فایل کتاب الکترونیکی Open)

دریافت داده‌های جدولی از XLSX با استفاده از Java

چگونه جداول را از Xlsx در Java استخراج کنیم

ابزارهای پیشرفته استخراج محتوا

تجزیه دقیق جدول در فرمت‌های مختلف

خواندن ساختارهای جدولی از منابع مختلف

تنظیمات استخراج جدول قابل تنظیم

نمونه: استخراج جداول از یک سند Excel

Java

معرفی API GroupDocs.Parser for Java

برای شروع آماده اید؟

منابع مفید

انواع اسناد پشتیبانی شده برای استخراج جداول

نکات مجوز موقت

`معرفی API GroupDocs.Parser for Java`

`برای شروع آماده اید؟`

`منابع مفید`

`انواع اسناد پشتیبانی شده برای استخراج جداول`

`نکات مجوز موقت`