GroupDocs.Parser for Java

استخراج لینک‌های هایپر از EPUB با Java

لینک‌های وب و هایپرلینک‌ها را از پی‌دی‌اف‌ها، فایل‌های Word، صفحات Excel و دیگر اسناد با استفاده از GroupDocs.Parser در محیط Java خود استخراج کنید.

نحوه استخراج لینک‌های هایپر از Epub در Java

GroupDocs.Parser استخراج لینک‌های هایپر از فایل‌های EPUB را در برنامه‌های Java با این مراحل ساده تسهیل می‌کند:

  1. فایل EPUB را با استفاده از یک نمونه از Parser باز کنید.
  2. اطمینان حاصل کنید که استخراج لینک‌های هایپر برای فرمت فایل در دسترس است.
  3. همه لینک‌های هایپر را با استفاده از روش مناسب استخراج کنید.
  4. از نتایج عبور کنید و هر لینک را به‌دلخواه پردازش کنید.
// فایلی که ممکن است شامل لینک‌های هایپر باشد را با استفاده از Parser بارگزاری کنید
try (Parser parser = new Parser("input.epub")) {

    // بررسی کنید که آیا فرمت سند از تجزیه لینک‌های هایپر پشتیبانی می‌کند
    if (!parser.getFeatures().isHyperlinks()) {
        System.out.println("استخراج لینک‌های هایپر برای این فایل در دسترس نیست");
        return;
    }

    // داده‌های لینک‌های هایپر را از سند استخراج و استفاده کنید
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks();

    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}
<dependencies> <dependency> <groupId>com.groupdocs</groupId> <artifactId>groupdocs-parser</artifactId> <version>24.9</version> </dependency> </dependencies> <repositories> <repository> <id>repository.groupdocs.com</id> <name>GroupDocs Repository</name> <url>https://repository.groupdocs.com/repo/</url> </repository> </repositories>
برای کپی کلیک کنید
کپی شد
نمونه‌های بیشتر مستندات

ابزارهای جامع تجزیه اسناد

علاوه بر استخراج لینک‌های هایپر، GroupDocs.Parser به شما امکان می‌دهد سایر محتوای مفید مانند متن ساده، رسانه‌های جاسازی شده و داده‌های ساختاریافته را برای استفاده در گردش‌کارهای خودکار جمع‌آوری کنید.

استخراج لینک‌های هایپر و تجزیه و تحلیل اسناد

تشخیص دقیق لینک

همه انواع لینک‌های هایپر را از چیدمان‌های مختلف سند، از جمله متن قابل کلیک و URL های پنهان، ضبط کنید.

کار با اسناد و محتوای وب

لینک‌ها را از فایل‌های PDF، DOCX، XLSX، HTML و تصاویری که شامل لینک‌های هایپر جاسازی شده هستند، استخراج کنید.

رفتار استخراج سفارشی

چگونگی استخراج لینک‌های هایپر را با استفاده از گزینه‌هایی مانند محدوده صفحات، نوع لینک‌ها یا فیلترهای محتوا بهینه کنید.

مثال: استخراج لینک‌های هایپر از یک PDF با گزینه‌های سفارشی

این نمونه نشان می‌دهد که چگونه می‌توان همه لینک‌ها را از یک فایل PDF با استفاده از تنظیمات استخراج لینک دریافت کرد.

Java

//  فایل PDF را با استفاده از کلاس Parser باز کنید
try (Parser parser = new Parser("input.docx"))
{
    // تأیید کنید که پشتیبانی از لینک‌های هایپر برای این سند فعال است
    if (!parser.getFeatures().isHyperlinks()) {
        return;
    }

    // گزینه‌ها را برای فیلتر لینک‌ها اعمال کنید
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // از تجزیه‌کننده برای دریافت داده‌های لینک‌های هایپر استفاده کنید
    Iterable<PageHyperlinkArea> hyperlinks = parser.getHyperlinks(options);

    // از طریق لینک‌ها عبور کنید و آن‌ها را به‌طور مناسب پردازش کنید
    for (PageHyperlinkArea h : hyperlinks) {
        System.out.println(h.getText());
        System.out.println(h.getUrl());
    }
}

درباره API GroupDocs.Parser for Java

GroupDocs.Parser یک API استخراج محتوا قدرتمند است که برای توسعه‌دهندگان Java طراحی شده است. این API ابزارهایی برای استخراج لینک‌های هایپر، داده‌های ساختاریافته، تصاویر و متن از فرمت‌های محبوب مانند DOCX، XLSX، PDF، HTML و بیشتر ارائه می‌دهد—بدون نیاز به پلاگین‌های خارجی.
بیشتر بدانید
About illustration

برای شروع آماده اید؟

GroupDocs.Parser را به صورت رایگان دانلود کنید یا یک مجوز آزمایشی برای دسترسی کامل دریافت کنید!

منابع مفید

برای ارتقاء تجربه خود ، مستندات ، نمونه های کد و پشتیبانی جامعه را کاوش کنید.

فرمت‌های مستنداتی که از استخراج لینک‌های هایپر پشتیبانی می‌کنند

با GroupDocs.Parser، می‌توانید لینک‌های هایپر را از بسیاری از فرمت‌های فایل رایج استخراج کنید. در زیر فهرستی از فرمت‌هایی که معمولاً پشتیبانی می‌شوند، آمده است.

نکات مجوز موقت

1
با ایمیل کاری خود ثبت نام کنید. خدمات پست الکترونیکی رایگان مجاز نیستند.
2
در مرحله دوم از دکمه دریافت مجوز موقت استفاده کنید.
 فارسی