GroupDocs.Parser ภาพรวม

API สำหรับการดำเนินการแยกเอกสารในแอพพลิเคชัน .NET

Illustration parser

แยกข้อมูลจากเอกสาร

GroupDocs.Parser for .NET API ช่วยให้คุณสามารถดึงข้อความ เมตาดาตา และรูปภาพจากรูปแบบไฟล์ที่หลากหลาย เช่น เอกสาร Office, อีเมล, ไฟล์แนบ และเอกสารเก็บถาวร เครื่องมือที่ทรงพลังนี้ช่วยให้คุณเข้าถึงและประมวลผลข้อมูลที่มีค่าในไฟล์เหล่านี้ได้อย่างมีประสิทธิภาพสำหรับแอพพลิเคชันต่างๆ เช่น การวิเคราะห์ข้อมูล, การจัดทำดัชนีเสิร์ชเอนจิน หรือระบบการจัดการเนื้อหา

วิเคราะห์เอกสาร

แยกองค์ประกอบต่างๆ เช่น ลิงก์, ตาราง, QR โค้ด, บาร์โค้ด และข้อมูลจากแบบฟอร์ม PDF นอกจากนี้ยังสามารถวิเคราะห์ข้อมูลเฉพาะจากเอกสารโดยใช้แม่แบบที่กำหนดเอง

ปรับแต่งผลลัพธ์

.NET API ช่วยให้คุณสามารถดึงข้อมูลในรูปแบบที่หลากหลาย เช่น แบบดิบ, แบบมีโครงสร้าง, HTML หรือ Markdown นอกจากนี้ API ยังมีฟังก์ชันการค้นหาที่ช่วยในการค้นหาคำหรือวลีเฉพาะภายในข้อความของเอกสาร

อิสระต่อแพลตฟอร์ม

GroupDocs.Parser for .NET รองรับระบบปฏิบัติการ เฟรมเวิร์ก และแพ็คเกจจัดการดังต่อไปนี้

Amazon
Docker
Azure
VS Code
ReSharper
macOS
Linux
NuGet

รูปแบบไฟล์ที่รองรับ

GroupDocs.Parser for .NET รองรับการดำเนินการกับ รูปแบบไฟล์ ต่อไปนี้

รูปแบบ Microsoft Office

  • Word: DOCX, DOC, DOCM, DOT, DOTX, DOTM, RTF
  • Excel: XLSX, XLS, XLSM, XLSB, XLTM, XLT, XLTM, XLTX, XLAM, SXC, SpreadsheetML
  • PowerPoint: PPT, PPTX, PPS, PPSX, PPSM, POT, POTM, POTX, PPTM

รูปภาพ & รูปแบบอื่นๆ

  • พกพาได้: PDF
  • รูปภาพ: JPG, BMP, PNG, TIFF, GIF
  • รูปแบบสำนักงานอื่นๆ: ODT, OTT, OTS, ODS, ODP, OTP, ODG

รูปแบบอื่นๆ

  • เว็บ: HTML, MHTML
  • เอกสารเก็บถาวร: ZIP, TAR, 7Z
  • สมุดอิเล็กทรอนิกส์: CHM, EPUB, FB2, MOBI

GroupDocs.Parser for .NET คุณสมบัติ

แยกข้อมูลจาก PDFs, เอกสาร Office และภาพได้อย่างรวดเร็วและแม่นยำ

Feature icon

แยกข้อความ

ดึงข้อมูลข้อความจากรูปแบบไฟล์ต่างๆ เช่น เอกสาร Office, ไฟล์ PDF และภาพเพื่อความอ่านง่ายและการวิเคราะห์

Feature icon

แยกรูปภาพ

กู้คืนเนื้อหาภาพจากแหล่งที่หลากหลาย เช่น เอกสาร Office, ไฟล์ PDF เพื่อความสะดวกในการเข้าถึงและใช้งาน

Feature icon

สแกน QR โค้ด

ตรวจจับและถอดรหัส QR โค้ดที่มีอยู่ในเอกสาร Office, ไฟล์ PDF หรือเนื้อหาภาพเพื่อการเรียกคืนข้อมูลที่มีประสิทธิภาพ

Feature icon

แยกข้อมูลจากไฟล์แนบและเอกสารเก็บถาวร

รวบรวมข้อมูลที่มีค่าจากข้อความอีเมล ไฟล์แนบ และแหล่งข้อมูลที่ถูกบีบอัดเพื่อการวิเคราะห์และการใช้งานที่มีประสิทธิภาพ

Feature icon

แยกตาราง

ระบุและแยกข้อมูลในตารางจากเอกสาร PDF สำหรับการวิเคราะห์และการใช้งานที่เป็นระเบียบ

Feature icon

แยกลิงก์

ค้นหาและแยกลิงก์และที่อยู่อีเมลภายในเอกสาร Office หรือไฟล์ PDF เพื่อเข้าถึงอย่างมีประสิทธิภาพ

Feature icon

วิเคราะห์แบบฟอร์ม PDF

แบบฟอร์ม PDF เป็นเอกสารดิจิตอลที่มีฟิลด์กรอกข้อมูลเพื่อให้ผู้ใช้สามารถกรอกข้อมูลได้ทางอิเล็กทรอนิกส์ API ของ .NET สามารถใช้ในการดึงข้อมูลจากแบบฟอร์มเหล่านี้เพื่อการประมวลผลที่มีประสิทธิภาพ

Feature icon

วิเคราะห์ข้อมูลตามแบบฟอร์ม

สร้างแม่แบบกำหนดเองและใช้ร่วมกับ API .NET เพื่อดึงข้อมูลเฉพาะจากไฟล์ PDF ซึ่งทำให้การแยกข้อมูลเป็นเรื่องง่าย

Feature icon

ค้นหาข้อความในเอกสาร

ค้นหาคำหรือรูปแบบเฉพาะในเอกสารได้อย่างรวดเร็ว

ตัวอย่างโค้ด

กรณีการใช้งานบางประการจากการดำเนินการที่เป็นที่นิยมใน GroupDocs.Parser for .NET

แยกรูปภาพจากเอกสาร PDF

GroupDocs.Parser for .NET ทำให้การแยกรูปภาพจาก เอกสาร เป็นเรื่องง่ายสำหรับนักพัฒนาที่ใช้ C#:

แยกรูปภาพจากเอกสาร PDF ใน C#

// สร้างอินสแตนซ์ของคลาส Parser
using (var parser = new Parser("source.pptx"))
{
    // แยกรูปภาพ
    var images = parser.GetImages();

    // ตรวจสอบว่ามีการแยกรูปภาพบางอย่าง
    if (images == null)
    {
        return;
    }
    // วนรอบรูปภาพ
    foreach (PageImageArea image in images)
    {
        // พิมพ์ดัชนีหน้า สี่เหลี่ยม และประเภทของรูปภาพ
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Type: {2}", 
            image.Page.Index, image.Rectangle, image.FileType));
    }
}

แยกรูปบาร์โค้ดจากภาพ

ใช้ API .NET ของเราเพื่อแยก บาร์โค้ด จากภาพ:

แยกรูปบาร์โค้ดจากรูปภาพใน C#

// โหลดภาพต้นฉบับไปยัง Parser
using (var parser = new Parser("source.jpg"))
{
    // ตรวจสอบว่าไฟล์รองรับการแยกรูปบาร์โค้ด
    if (parser.Features.Barcodes)
    {
        // แยกรูปบาร์โค้ดจากไฟล์
        var barcodes = parser.GetBarcodes();

        // วนรอบรูปบาร์โค้ด
        foreach (var barcode in barcodes)
        {
            // พิมพ์ดัชนีหน้า
            Console.WriteLine("Page: " + barcode.Page.Index.ToString());
            // พิมพ์ค่าบาร์โค้ด
            Console.WriteLine("Value: " + barcode.Value);
        }
    }
}

พร้อมที่จะเริ่มต้นหรือยัง?

ดาวน์โหลด GroupDocs.Parser ฟรีหรือรับสิทธิ์การใช้งานแบบทดลองใช้เพื่อการเข้าถึงแบบเต็ม!

ทรัพยากรที่มีประโยชน์

สำรวจเอกสารตัวอย่างรหัสและการสนับสนุนชุมชนเพื่อปรับปรุงประสบการณ์ของคุณ

เคล็ดลับใบอนุญาตชั่วคราว

1
ลงทะเบียนด้วยอีเมลที่ทำงานของคุณ ไม่อนุญาตให้ใช้บริการอีเมลฟรี
2
ใช้ปุ่ม รับใบอนุญาตชั่วคราว ในขั้นตอนที่ 2
 ไทย