GroupDocs.Parser for .NET

Витяг таблиць з DOCX за допомогою C#

Швидко визначайте та витягуйте структури таблиць з PDF, Word, Excel та інших форматів файлів, використовуючи GroupDocs.Parser у ваших проектах .NET.

Кроки для витягнення таблиць з Docx в C#

Дотримуйтесь цих інструкцій, щоб витягти таблиці з файлів DOCX за допомогою GroupDocs.Parser у вашому середовищі .NET:

  1. Ініціалізуйте екземпляр Parser та завантажте ваш документ DOCX.
  2. Перевірте, чи підтримується витягнення таблиць для вхідного формату.
  3. Витягніть вміст таблиці з файлу.
  4. Використовуйте структуровані дані таблиці для звітування, автоматизації або аналітики.
// Відкрийте документ, що містить дані таблиці, використовуючи Parser
using (Parser parser = new Parser("input.docx")) {

    // Перевірте, чи підтримує формат розпізнавання таблиць
    if (!parser.Features.Tables) {
        Console.WriteLine("Обробляйте документи, що не підтримують парсинг таблиць");
        return;
    }

    // Визначте, як слід розпізнавати структуру таблиці
    TemplateTableLayout layout = new TemplateTableLayout(
        new double[] { 50, 95, 275, 415, 485, 545 },
        new double[] { 325, 340, 365, 395 });

    // Вкажіть параметри витягнення для даних таблиці
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    //  Витягніть таблиці з вмісту файлу
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    //  Перебирайте кожну виявлену таблицю
    foreach (PageTableArea t in tables)
    {
    }
}
dotnet add package GroupDocs.Parser
натисніть, щоб скопіювати
скопійовано
Більше прикладів Документація

Потужні можливості витягнення даних

Крім парсингу таблиць, GroupDocs.Parser може витягувати багатий контент, такий як текстові блоки, зображення, метадані та інші структуровані дані для автоматизації документів.

Розпізнавання таблиць і витягнення вмісту

Точне виявлення таблиць у кількох форматах

Витягуйте табличні дані з DOCX, XLSX, PDF, HTML та аналогічних форматів з високою точністю.

Парсинг структур таблиць з файлів

Ефективно отримуйте дані таблиць з документів та електронних таблиць без втрати форматування.

Гнучка конфігурація витягнення таблиць

Налаштовуйте виявлення макета, вирівнювання стовпців та параметри заголовка/підзаголовка для точного контролю за вихідними даними.

Як витягнути таблиці з Excel електронних таблиць

Цей кодовий приклад демонструє, як читати та перебирати дані таблиці в файлі XLSX за допомогою GroupDocs.Parser.

C#

//  Відкрийте файл Excel за допомогою API Parser
using (Parser parser = new Parser("input.xlsx"))
{
    // Вийдіть, якщо таблиці не можуть бути витягнені з файлу
    if (!parser.Features.Tables)
    {
        return;
    }

    // Використовуйте правила макета для знаходження табличного контенту
    TemplateTableLayout layout = new TemplateTableLayout(
            new double[] { 50, 95, 275, 415, 485, 545 },
            new double[] { 325, 340, 365, 395 });

    // Налаштуйте параметри витягнення для таблиць
    PageTableAreaOptions options = new PageTableAreaOptions(layout);

    // Виконайте операцію витягнення таблиці
    IEnumerable<PageTableArea> tables = parser.GetTables(options);

    // Перегляньте кожну виявлену структуру таблиці
    foreach (PageTableArea t in tables)
    {
        // Перебирання кожного рядка в таблиці
        for (int row = 0; row < t.RowCount; row++)
        {
            // Цикл по клітинам в кожному рядку
            for (int column = 0; column < t.ColumnCount; column++)
            {
                // Отримайте доступ до клітини поточної таблиці
                PageTableAreaCell cell = t[row, column];
                if (cell != null)
                {
                    // Відобразіть текстовий вміст кожної клітини
                    Console.Write(cell.Text);
                    Console.Write(" | ");
                }
            }
        }
    }
}

Про API GroupDocs.Parser for .NET

GroupDocs.Parser — це універсальний API для парсингу документів, створений для розробників .NET. Він дозволяє точно витягувати текст, таблиці, зображення, гіперпосилання та інші структуровані елементи з форматів, таких як PDF, DOCX, XLSX, PPTX та багатьох інших — без необхідності у сторонньому програмному забезпеченні.
Дізнатися більше
About illustration

Готові почати?

Завантажте GroupDocs.Parser безкоштовно або отримайте пробну ліцензію для повного доступу!

Корисні ресурси

Вивчіть документацію, зразки коду та підтримку спільноти для покращення вашого досвіду.

Підтримувані формати для витягнення таблиць

GroupDocs.Parser може витягувати дані таблиць з різних типів документів. Нижче наведено найбільш поширені формати для структурованого парсингу таблиць.

Поради щодо тимчасової ліцензії

1
Зареєструйтеся за допомогою вашої робочої e-mail. Безкоштовні поштові служби заборонені.
2
Скористайтеся кнопкою Отримати тимчасову ліцензію на другому кроці.
 Українська