Как удалить текст из файлов RTF с помощью регулярных выражений и Java

API GroupDocs.Redaction Java позволяет редактировать, скрывать или удалять конфиденциальный текст из текстовых документов, таблиц, презентаций, PDF и изображений с помощью регулярных выражений.


Скачать бесплатную пробную версию

Что такое очистка текста?

Редактирование или очистка текста — это процесс удаления конфиденциального или нежелательного текста или информации из цифровых документов, при этом остальная часть документа или параграфа, содержащего его, остается нетронутой. Редактирование помогает пользователям, а также организациям защитить свою конфиденциальную информацию, скрывая или удаляя ее без возможности восстановления. Используя GroupDocs.Redaction Java API, пользователи теперь могут редактировать, скрывать или удалять конфиденциальный текст из текстовых документов, рабочих листов, презентаций, PDF и файлов растровых изображений. API предоставляет широкий спектр возможностей и методов для редактирования частной информации в документах. Он поддерживает поиск и редактирование с использованием регулярных выражений, использование текстовых (коды исключений) или графических (цветные прямоугольники) редакций и многое другое. Так почему бы не попробовать автоматизировать процесс редактирования документов, загрузив API и изучив его основные и расширенные функции.

Исправить RTF с помощью регулярных выражений в Java

GroupDocs.Redaction позволяет легко редактировать данные конфиденциального или личного характера из ваших документов. Самый популярный случай редактирования — удаление текста из документа.

Следующий код можно использовать для редактирования текста в определенной части документа с помощью регулярного выражения. Это позволяет пользователям заменять все числа, сопоставляя шаблон «AA BB CCCCCC» с прямоугольником синего цвета,

Удалить конфиденциальные данные из RTF

  • Создайте экземпляр класса Redactor и загрузите файл RTF
  • Создайте экземпляр класса RegexRedaction.
  • Вызвать метод redactor.apply с объектом класса RegexRedaction
  • Вызовите метод redactor.save, чтобы сохранить изменения


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Системные Требования

GroupDocs.Redaction for Java API поддерживаются на всех основных платформах и операционных системах. Чтобы ознакомиться с полным руководством по системным требованиям, посетите [системные требования] (https://docs.groupdocs.com/redaction/java/system-requirements). Перед выполнением приведенного ниже кода убедитесь, что в вашей системе установлены следующие предварительные условия. :

Зачем использовать GroupDocs.Redaction

  • Разрешить пользователям добавлять пользовательские форматы документов и типы редакций
  • Для удаления конфиденциальной информации не требуется дополнительное программное обеспечение.
  • Возможность установить документ рендеринга диапазона страниц как PDF
  • Простой способ редактирования различных типов метаданных: имя автора, версия, название, тема, описание и многое другое.
  • Извлечение информации о документе — тип файла, количество страниц и т. д.


What is RTF File Format?

Представленный и задокументированный Microsoft формат Rich Text Format (RTF) представляет собой метод кодирования форматированного текста и графики для использования в приложениях. Этот формат облегчает межплатформенный обмен документами с другими продуктами Microsoft, что служит цели функциональной совместимости. Эта возможность делает его стандартом передачи данных между программным обеспечением для обработки текстов, и, следовательно, содержимое может быть передано из одной операционной системы в другую без потери форматирования документа.

Read More

Популярный Редакция Выбор

Изменить CSV Файлы

(Файл значений, разделенных запятыми)

Изменить DOC Файлы

(Документ Microsoft Word)

Изменить DOCM Файлы

(Документ Microsoft Word с поддержкой макросов)

Изменить DOCX Файлы

(Документ Microsoft Word с открытым XML)

Изменить DOT Файлы

(Шаблон документа Microsoft Word)

Изменить DOTM Файлы

(Шаблон Microsoft Word с поддержкой макросов)

Изменить DOTX Файлы

(Шаблон документа Word Open XML)

Изменить PDF Файлы

(Портативный документ)

Изменить POT Файлы

(Шаблон PowerPoint)

Изменить POTM Файлы

(Шаблон Microsoft PowerPoint)

Изменить PPS Файлы

(Слайд-шоу Microsoft PowerPoint)

Изменить PPSM Файлы

(Слайд-шоу Microsoft PowerPoint)

Изменить PPSX Файлы

(Слайд-шоу PowerPoint Open XML)

Изменить PPT Файлы

(Презентация PowerPoint)

Изменить PPTM Файлы

(Презентация Microsoft PowerPoint)

Изменить PPTX Файлы

(Презентация PowerPoint Open XML)

Изменить XLS Файлы

(Формат двоичного файла Microsoft Excel)

Изменить XLSM Файлы

(Электронная таблица Microsoft Excel с поддержкой макросов)

Изменить XLSX Файлы

(Электронная таблица Microsoft Excel Open XML)

Изменить XLT Файлы

(Шаблон Microsoft Excel)

Изменить XLTM Файлы

(Шаблон Microsoft Excel с поддержкой макросов)

Изменить XLTX Файлы

(Открытый XML-шаблон Microsoft Excel)

Back to top
 Русский