Этот пример демонстрирует извлечение текстовых блоков вместе с их пространственными координатами из презентации PowerPoint с использованием GroupDocs.Parser.
Java
// Загрузите ваш файл PPTX с помощью API Parser
try (Parser parser = new Parser("input.pptx"))
{
// Получите все прямоугольные текстовые зоны
IEnumerable<PageTextArea> areas = parser.GetTextAreas();
// Выходите, если эта функция не поддерживается
if (areas == null)
{
return;
}
// Обходите текстовые области по страницам
for (PageTextArea a : areas)
{
// Обрабатывайте каждый текстовый блок с его номером страницы и ограничивающей прямоугольной областью
System.out.println(String.format("Page: %d, R: %s, Text: %s", a.getPage().getIndex(), a.getRectangle(), a.getText()));
}
}