ตัวอย่างนี้แสดงวิธีการดึงข้อมูลที่มีโครงสร้างจาก PDF โดยใช้แม่แบบการแยกวิเคราะห์ที่กำหนดไว้ล่วงหน้าด้วย GroupDocs.Parser.
C#
// โหลดไฟล์ PDF ด้วยคลาส Parser
using (Parser parser = new Parser("input.pdf"))
{
// แยกวิเคราะห์เอกสารตามแม่แบบ
DocumentData data = parser.ParseByTemplate(GetTemplate());
// ตรวจสอบว่าการดึงข้อมูลฟอร์มได้รับการสนับสนุนหรือไม่
if (data == null)
{
return;
}
// ประมวลผลฟิลด์ที่ได้รับ
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
private static Template GetTemplate()
{
// สร้างพารามิเตอร์ตรวจจับสำหรับตาราง 'รายละเอียด'
TemplateTableParameters detailsTableParameters =
new TemplateTableParameters(new Rectangle(new Point(35, 320), new Size(530, 55)), null);
TemplateItem[] templateItems = new TemplateItem[]
{
new TemplateTable(detailsTableParameters, "details", null)
};
Template template = new Template(templateItems);
return template;
}