GroupDocs.Parser ภาพรวม

API สำหรับการดำเนินการแยกเอกสารในแอพพลิเคชัน Java

Illustration parser

แยกข้อมูลจากเอกสาร

GroupDocs.Parser for Java API ช่วยให้คุณสามารถดึงข้อความ เมตาดาตา และรูปภาพจากรูปแบบไฟล์ที่หลากหลาย เช่น เอกสาร Office, อีเมล, ไฟล์แนบ และเอกสารเก็บถาวร เครื่องมือที่ทรงพลังนี้ช่วยให้คุณเข้าถึงและประมวลผลข้อมูลที่มีค่าในไฟล์เหล่านี้ได้อย่างมีประสิทธิภาพสำหรับแอพพลิเคชันต่างๆ เช่น การวิเคราะห์ข้อมูล, การจัดทำดัชนีเสิร์ชเอนจิน หรือระบบการจัดการเนื้อหา

วิเคราะห์เอกสาร

แยกองค์ประกอบต่างๆ เช่น ลิงก์, ตาราง, QR โค้ด, บาร์โค้ด และข้อมูลจากแบบฟอร์ม PDF นอกจากนี้ยังสามารถวิเคราะห์ข้อมูลเฉพาะจากเอกสารโดยใช้แม่แบบที่กำหนดเอง

ปรับแต่งผลลัพธ์

Java API ช่วยให้คุณสามารถดึงข้อมูลในรูปแบบที่หลากหลาย เช่น แบบดิบ, แบบมีโครงสร้าง, HTML หรือ Markdown นอกจากนี้ API ยังมีฟังก์ชันการค้นหาที่ช่วยในการค้นหาคำหรือวลีเฉพาะภายในข้อความของเอกสาร

อิสระต่อแพลตฟอร์ม

GroupDocs.Parser for Java รองรับระบบปฏิบัติการ เฟรมเวิร์ก และแพ็คเกจจัดการดังต่อไปนี้

Amazon
Docker
Azure
Eclipse
IntelliJ
Windows
Linux
Maven

รูปแบบไฟล์ที่รองรับ

GroupDocs.Parser for Java รองรับการดำเนินการกับ รูปแบบไฟล์ ต่อไปนี้

รูปแบบ Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

รูปภาพ & รูปแบบอื่นๆ

  • พกพาได้: PDF
  • รูปภาพ: JPG, BMP, PNG, TIFF, GIF
  • รูปแบบสำนักงานอื่นๆ: ODT, OTT, OTS, ODS, ODP, OTP, ODG

รูปแบบอื่นๆ

  • เว็บ: HTML, MHTML
  • เอกสารเก็บถาวร: ZIP, TAR, 7Z
  • สมุดอิเล็กทรอนิกส์: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for Java คุณสมบัติ

แยกข้อมูลจาก PDFs, เอกสาร Office และภาพได้อย่างรวดเร็วและแม่นยำ

Feature icon

แยกข้อความ

ดึงข้อมูลข้อความจากรูปแบบไฟล์ต่างๆ เช่น เอกสาร Office, ไฟล์ PDF และภาพเพื่อความอ่านง่ายและการวิเคราะห์

Feature icon

แยกรูปภาพ

กู้คืนเนื้อหาภาพจากแหล่งที่หลากหลาย เช่น เอกสาร Office, ไฟล์ PDF เพื่อความสะดวกในการเข้าถึงและใช้งาน

Feature icon

สแกน QR โค้ด

ตรวจจับและถอดรหัส QR โค้ดที่มีอยู่ในเอกสาร Office, ไฟล์ PDF หรือเนื้อหาภาพเพื่อการเรียกคืนข้อมูลที่มีประสิทธิภาพ

Feature icon

แยกข้อมูลจากไฟล์แนบและเอกสารเก็บถาวร

รวบรวมข้อมูลที่มีค่าจากข้อความอีเมล ไฟล์แนบ และแหล่งข้อมูลที่ถูกบีบอัดเพื่อการวิเคราะห์และการใช้งานที่มีประสิทธิภาพ

Feature icon

แยกตาราง

ระบุและแยกข้อมูลในตารางจากเอกสาร PDF สำหรับการวิเคราะห์และการใช้งานที่เป็นระเบียบ

Feature icon

แยกลิงก์

ค้นหาและแยกลิงก์และที่อยู่อีเมลภายในเอกสาร Office หรือไฟล์ PDF เพื่อเข้าถึงอย่างมีประสิทธิภาพ

Feature icon

วิเคราะห์แบบฟอร์ม PDF

แบบฟอร์ม PDF เป็นเอกสารดิจิตอลที่มีฟิลด์กรอกข้อมูลเพื่อให้ผู้ใช้สามารถกรอกข้อมูลได้ทางอิเล็กทรอนิกส์ API ของ .NET สามารถใช้ในการดึงข้อมูลจากแบบฟอร์มเหล่านี้เพื่อการประมวลผลที่มีประสิทธิภาพ

Feature icon

วิเคราะห์ข้อมูลตามแบบฟอร์ม

สร้างแม่แบบกำหนดเองและใช้ร่วมกับ API .NET เพื่อดึงข้อมูลเฉพาะจากไฟล์ PDF ซึ่งทำให้การแยกข้อมูลเป็นเรื่องง่าย

Feature icon

ค้นหาข้อความในเอกสาร

ค้นหาคำหรือรูปแบบเฉพาะในเอกสารได้อย่างรวดเร็ว

ตัวอย่างโค้ด

กรณีการใช้งานบางประการจากการดำเนินการที่เป็นที่นิยมใน GroupDocs.Parser for Java

แยกรูปภาพจากเอกสาร PDF

GroupDocs.Parser for Java ทำให้การแยกรูปภาพจาก เอกสาร เป็นเรื่องง่ายสำหรับนักพัฒนาที่ใช้ Java:

แยกรูปภาพจากเอกสาร PDF ใน Java

// สร้างอินสแตนซ์ของคลาส Parser
try (Parser parser = new Parser("source.pdf"))
{
    // แยกรูปภาพ
    Iterable<PageImageArea> images = parser.getImages();

    // ตรวจสอบว่ามีการแยกรูปภาพบางอย่าง
    if (images == null) {
        return;
    }

    // วนรอบรูปภาพ
    for (PageImageArea image : images) {
        // พิมพ์ดัชนีหน้า สี่เหลี่ยม และประเภทของรูปภาพ
        System.out.println(String.format("Page: %d, R: %s, Type: %s", 
            image.getPage().getIndex(), image.getRectangle(), image.getFileType()));
    }
}

แยกรูปบาร์โค้ดจากภาพ

ใช้ API Java ของเราเพื่อแยก บาร์โค้ด จากภาพ:

แยกรูปบาร์โค้ดจากรูปภาพใน Java

// โหลดภาพต้นฉบับไปยัง Parser
try (Parser parser = new Parser("source.jpg")){

    // ตรวจสอบว่าไฟล์รองรับการแยกรูปบาร์โค้ด
    if (!parser.getFeatures().isBarcodes()) {

        // แยกรูปบาร์โค้ดจากไฟล์
        Iterable<PageBarcodeArea> barcodes = parser.getBarcodes();

        // วนรอบรูปบาร์โค้ด
        for (PageBarcodeArea barcode : barcodes) {
            // พิมพ์ดัชนีหน้า
            System.out.println("Page: " + barcode.getPage().getIndex());
            // พิมพ์ค่าบาร์โค้ด
            System.out.println("Value: " + barcode.getValue());
        }
    }
}

พร้อมที่จะเริ่มต้นหรือยัง?

ดาวน์โหลด GroupDocs.Parser ฟรีหรือรับสิทธิ์การใช้งานแบบทดลองใช้เพื่อการเข้าถึงแบบเต็ม!

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

เคล็ดลับใบอนุญาตชั่วคราว

1
ลงทะเบียนด้วยอีเมลที่ทำงานของคุณ ไม่อนุญาตให้ใช้บริการอีเมลฟรี
2
ใช้ปุ่ม รับใบอนุญาตชั่วคราว ในขั้นตอนที่ 2
 ไทย