GroupDocs.Parser for Java

ดึงข้อมูลตารางจาก RTF โดยใช้ Java

ตรวจจับและดึงตารางจากรูปแบบต่างๆ เช่น PDF, DOCX และ XLSX อย่างไร้รอยต่อด้วย GroupDocs.Parser ในการทำงานของ Java ของคุณ.

วิธีการดึงตารางจาก Rtf ใน Java

ในการวิเคราะห์ตารางจากเอกสาร RTF โดยใช้ GroupDocs.Parser ให้ปฏิบัติตามขั้นตอนเหล่านี้ในสภาพแวดล้อม Java ของคุณ:

  1. สร้างอินสแตนซ์ของ Parser และโหลดไฟล์ RTF ที่ต้องการ.
  2. ตรวจสอบว่าไฟล์นั้นรองรับการดึงตารางที่มีโครงสร้าง.
  3. ใช้ API เพื่อตรวจจับองค์ประกอบตารางจากเอกสาร.
  4. ใช้ข้อมูลที่ดึงมาในการวิเคราะห์ การทำรายงาน หรือระบบอัตโนมัติ.
// โหลดเอกสารที่มี Parser ซึ่งรวมถึงองค์ประกอบตาราง
try (Parser parser = new Parser("input.rtf"))
{
    // ตรวจสอบว่าเอกสารประเภทนั้นอนุญาตให้ตรวจจับตาราง
    if (!parser.getFeatures().isTables()) {
        System.out.println("เพิ่มตรรกะสำหรับไฟล์ที่ไม่รองรับตาราง");
        return;
    }

    // กำหนดกฎสำหรับการตีความโครงสร้างตาราง
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // ตั้งค่าพารามิเตอร์สำหรับการดึงตาราง
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  ดำเนินการดึงตารางจากเอกสารที่โหลดแล้ว
    Iterable<PageTableArea> tables = parser.getTables(options);

    //  ประมวลผลแต่ละตารางที่ดึงออกมาจากผลลัพธ์
    for (PageTableArea t : tables) 
    {
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
คลิกเพื่อคัดลอก
คัดลอกแล้ว
ตัวอย่างเพิ่มเติม เอกสารประกอบ

เครื่องมือการดึงข้อมูลขั้นสูง

นอกเหนือจากการอ่านตารางแล้ว GroupDocs.Parser ยังรองรับการจับข้อมูลพื้นฐาน องค์ประกอบภาพ เมตาดาต้าแบบฝัง และวัตถุที่มีโครงสร้างเพื่อเสริมสร้างงานประมวลผลเอกสาร.

การดึงเนื้อหาที่มีโครงสร้างและข้อมูลตาราง

การวิเคราะห์ตารางอย่างแม่นยำในหลายรูปแบบ

รองรับการดึงตารางจากประเภทเอกสารมาตรฐาน เช่น PDF, Word, Excel และ HTML อย่างมีความแม่นยำสูง.

อ่านโครงสร้างตารางจากแหล่งที่หลากหลาย

ดึงข้อมูลตารางจากแผ่นงาน เอกสาร และรายงาน ในขณะที่ยังรักษาโครงสร้างและการจัดตำแหน่ง.

การตั้งค่าการดึงตารางที่ปรับแต่งได้

ควบคุมการตรวจจับเลย์เอาต์ จัดการส่วนหัวและส่วนท้าย และปรับแต่งการดึงข้อมูลด้วยตัวเลือกการกำหนดค่าที่ยืดหยุ่น.

ตัวอย่าง: ดึงตารางจากเอกสาร Excel

ตัวอย่างนี้แสดงวิธีการดึงและวนลูปผ่านเนื้อหาตารางในไฟล์ Excel (XLSX) โดยใช้ GroupDocs.Parser.

Java

//  เริ่มต้น Parser ด้วยไฟล์ Excel
try (Parser parser = new Parser("input.pdf"))
{
    // ออกจากระบบหากการดึงข้อมูลตารางไม่รองรับสำหรับเอกสารนี้
    if (!parser.getFeatures().isTables())
    {
        return;
    }

    // ใช้กฎเพื่อค้นหาเลย์เอาต์ตาราง
    TemplateTableLayout layout = new TemplateTableLayout(
            java.util.Arrays.asList(new Double[]{50.0, 95.0, 275.0, 415.0, 485.0, 545.0}),
            java.util.Arrays.asList(new Double[]{325.0, 340.0, 365.0, 395.0}));

    // กำหนดค่าการตั้งสำหรับการดึงตาราง
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // เรียกใช้กระบวนการดึงข้อมูล
    Iterable<PageTableArea> tables = parser.getTables(options);

    // วนลูปผ่านโครงสร้างตารางที่วิเคราะห์ทั้งหมด
    for (PageTableArea t : tables)
    {
        // วนซ้ำแต่ละแถวภายในตาราง
        for (int row = 0; row < t.getRowCount(); row++)
        {
            // ประมวลผลแต่ละเซลล์ในแถวปัจจุบัน
            for (int column = 0; column < t.getColumnCount(); column++) 
            {
                // เข้าถึงและอ่านเนื้อหาของเซลล์ปัจจุบัน
                PageTableAreaCell cell = t.getCell(row, column);
                if (cell != null)
                {
                    // แสดงค่าข้อความของเซลล์ตารางแต่ละเซลล์
                    System.out.print(cell.getText());
                    System.out.print(" | ");
                }
            }
        }
    }
}

แนะนำ API ของ GroupDocs.Parser for Java

GroupDocs.Parser คือ API การดึงข้อมูลที่มีฟีเจอร์ครบถ้วนสำหรับแพลตฟอร์ม Java ช่วยให้นักพัฒนาสามารถวิเคราะห์ตาราง ข้อความ กราฟิก ลิงก์ และข้อมูลที่มีโครงสร้างจากไฟล์ PDF เอกสาร Word แผ่น Excel งานนำเสนอ PowerPoint และอื่นๆ ได้อย่างแม่นยำ—โดยไม่จำเป็นต้องใช้ปลั๊กอินของบุคคลที่สาม.
เรียนรู้เพิ่มเติม
About illustration

พร้อมที่จะเริ่มต้นหรือยัง?

ดาวน์โหลด GroupDocs.Parser ฟรีหรือรับสิทธิ์การใช้งานแบบทดลองใช้เพื่อการเข้าถึงแบบเต็ม!

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

ประเภทเอกสารที่รองรับสำหรับการดึงตาราง

GroupDocs.Parser ให้การตรวจจับตารางที่เชื่อถือได้จากหลายประเภทไฟล์ นี่คือรายการรูปแบบเอกสารที่ได้รับการสนับสนุนอย่างกว้างขวางสำหรับการดึงตาราง.

เคล็ดลับใบอนุญาตชั่วคราว

1
ลงทะเบียนด้วยอีเมลที่ทำงานของคุณ ไม่อนุญาตให้ใช้บริการอีเมลฟรี
2
ใช้ปุ่ม รับใบอนุญาตชั่วคราว ในขั้นตอนที่ 2
 ไทย