این نمونه نشان میدهد که چگونه میتوان فیلدهای ساختاری را از یک PDF با استفاده از یک الگوی سفارشی از طریق GroupDocs.Parser استخراج کرد.
Java
// PDF را با کلاس Parser باز کنید
try (Parser parser = new Parser("input.pdf"))
{
// الگوی تجزیه را برای استخراج دادههای تعریفشده اعمال کنید
DocumentData data = parser.parseByTemplate(GetTemplate());
// بررسی کنید که آیا استخراج بر مبنای الگو در دسترس است
if (data == null) {
return;
}
// با فیلدهای داده استخراجشده کار کنید
for (int i = 0; i < data.getCount(); i++) {
System.out.print(data.get(i).getName() + ": ");
PageTextArea area = data.get(i).getPageArea() instanceof PageTextArea
? (PageTextArea) data.get(i).getPageArea() : null;
System.out.println(area == null ? "Not a template field" : area.getText());
}
}
private static Template GetTemplate()
{
// تنظیمات تشخیصدهنده را برای استخراج بخش 'جزئیات' تعریف کنید
TemplateTableParameters detailsTableParameters =
new TemplateTableParameters(new Rectangle(new Point(35, 320), new Size(530, 55)), null);
TemplateItem[] templateItems = new TemplateItem[]
{
new TemplateTable(detailsTableParameters, "details", null)
};
Template template = new Template(java.util.Arrays.asList(templateItems));
return template;
}