GroupDocs.Parser for .NET

Витягання гіперпосилань з PPTX за допомогою C#

Виявляйте та витягайте URL-адреси та гіперпосилання з PDF, Word, Excel та інших типів документів, використовуючи GroupDocs.Parser у ваших додатках .NET.

Кроки для витягання гіперпосилань з Pptx в C#

GroupDocs.Parser дозволяє розробникам .NET витягувати гіперпосилання з файлів PPTX, дотримуючись цих простих кроків:

  1. Завантажте файл PPTX за допомогою екземпляра Parser.
  2. Перевірте, чи документ підтримує витягання гіперпосилань.
  3. Отримайте список гіперпосилань з документа.
  4. Обробіть результати та працюйте з витягнутими URL-адресами.
// Завантажте документ, що містить гіперпосилання, за допомогою класу Parser
using (Parser parser = new Parser("input.pptx")) {

    // Перевірте, чи підтримує файл витягання гіперпосилань
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Витягання гіперпосилань недоступне для файлу");
        return;
    }

    // Отримайте та обробіть витягнуті гіперпосилання
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();

    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}
dotnet add package GroupDocs.Parser
натисніть, щоб скопіювати
скопійовано
Більше прикладів Документація

Розширені можливості парсингу документів

Окрім витягання гіперпосилань, GroupDocs.Parser також дозволяє витягувати текст, метадані, зображення та структуровані дані — підтримуючи потужні робочі процеси обробки даних.

Виявлення гіперпосилань і парсинг документів

Виявлення гіперпосилань з документів

Швидко витягуйте URL-адреси та анотації посилань з документів, таких як PDF, файли Word, електронні таблиці та інші.

Підтримка веб і вбудованих посилань

Виявляйте та витягуйте як стандартні веб URL, так і вбудовані посилання з документів у різних форматах.

Гнучкі параметри парсингу

Налаштуйте параметри витягання для сканування конкретних секцій або сторінок для підвищення продуктивності та точності.

Як витягнути гіперпосилання з PDF, використовуючи параметри посилань

Цей приклад коду показує, як витягувати всі гіперпосилання з PDF файлу, використовуючи користувацькі параметри.

C#

//  Ініціалізуйте Parser з документом PDF
using (Parser parser = new Parser("input.docx"))
{
    // Перевірте, чи підтримується витягання гіперпосилань
    if (!parser.Features.Hyperlinks)
    {
        return;
    }

    // Встановіть параметри витягання посилань для звуження результатів
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));

    // Витягніть дані гіперпосилань з документа
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);

    // Обробіть список витягнутих посилань
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        Console.WriteLine(h.Text);
        Console.WriteLine(h.Url);
    }
}

Про API GroupDocs.Parser for .NET

GroupDocs.Parser — універсальний API для парсингу документів для розробників .NET. Він підтримує витягання гіперпосилань, тексту, зображень та структурованого контенту з різних форматів файлів, таких як PDF, Word, Excel, HTML та багато інших — без reliance на стороннє програмне забезпечення.
Дізнатися більше
About illustration

Готові почати?

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Підтримувані формати для витягання гіперпосилань

GroupDocs.Parser може витягувати гіперпосилання з широкого спектра типів документів. Дивіться нижче список найпоширеніших форматов.

Поради щодо тимчасової ліцензії

1
Зареєструйтеся за допомогою вашої робочої e-mail. Безкоштовні поштові служби заборонені.
2
Скористайтеся кнопкою Отримати тимчасову ліцензію на другому кроці.
 Українська