Cum să eliminați text din fișierele PDF folosind expresii regulate și Java

API-ul GroupDocs.Redaction Java permite redactarea, ascunderea sau eliminarea textului sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și imagini folosind expresii obișnuite.


Descarcare varianta scurta de prezentare gratuita

Ce este dezinfectarea textului?

Redactarea sau igienizarea textului este procesul de eliminare a textului sau a informațiilor confidențiale sau nedorite din documentele digitale, lăsând intact restul documentului sau al paragrafului care le conține. Redaction ajută utilizatorii, precum și organizația să își protejeze informațiile sensibile, ascunzându-le sau eliminându-le definitiv. Folosind GroupDocs.Redaction Java utilizatorii API-ului pot acum redacta, ascunde sau elimina text sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și fișiere imagine raster. API-ul oferă o gamă largă de opțiuni și metode pentru redactarea informațiilor private din documente. Acceptă căutarea și redactarea folosind expresii regulate, utilizarea redactărilor textuale (coduri de exceptare) sau grafice (dreptunghiuri colorate) și multe altele. Așadar, de ce să nu încercați și să vă automatizați procesul de redactare a documentelor descărcând API-ul și explorați funcțiile sale de bază și avansate.

Redactați PDF folosind expresii regulate în Java

GroupDocs.Redaction permite eliminarea cu ușurință a datelor de natură sensibilă sau privată din documentele dvs. Cel mai popular caz de redactare este eliminarea unui text dintr-un document.

Următorul cod poate fi folosit pentru a aplica redactarea textuală unei anumite părți a unui document folosind expresia regulată. Permite utilizatorilor să înlocuiască toate numerele, potrivirea modelului „AA BB CCCCCC” cu un dreptunghi de culoare albastră,

Eliminați datele sensibile din PDF

  • Creați o instanță a clasei Redactor și încărcați fișierul PDF
  • Creați o instanță a clasei RegexRedaction
  • Apelați metoda redactor.apply cu obiectul clasei RegexRedaction
  • Apelați metoda redactor.save pentru a salva modificările


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Cerințe de sistem

GroupDocs.Redaction for Java API-urile sunt acceptate pe toate platformele și sistemele de operare majore. Pentru ghidul complet al cerințelor de sistem, vă rugăm să vizitați cerințe de sistem Înainte de a executa codul de mai jos, vă rugăm să vă asigurați că aveți următoarele cerințe preliminare instalate pe sistemul dvs. :

  • Sisteme de operare: Microsoft Windows, Linux, MacOS
  • Mediu de dezvoltare: NetBeans, Intellij IDEA, Eclipse etc
  • Java Mediu de rulare: J2SE 6.0 și versiuni ulterioare
  • Obțineți cea mai recentă versiune a GroupDocs.Redaction for Java de la Maven

De ce să folosiți GroupDocs.Redaction

  • Permiteți utilizatorilor să adauge formate de documente personalizate și tipuri de redactări
  • Nu este necesar niciun software suplimentar pentru a elimina informațiile sensibile
  • Posibilitatea de a seta documentul de randare a intervalului de pagini ca PDF
  • O modalitate ușoară de a redacta diferite tipuri de metadate: numele autorului, versiunea, titlul, subiectul, descrierea și multe altele
  • Extragerea informațiilor documentului - tip de fișier, număr de pagini etc.


What is PDF File Format?

Portable Document Format (PDF) is a type of document created by Adobe back in 1990s. The purpose of this file format was to introduce a standard for representation of documents and other reference material in a format that is independent of application software, hardware as well as Operating System. PDF files can be opened in Adobe Acrobat Reader/Writer as well in most modern browsers like Chrome, Safari, Firefox via extensions/plug-ins. Most of the commercially available software suites also offer conversion of their documents to PDF file format without the requirement of any additional software component.

Read More

Popular Redactare Opțiuni

Redact CSV Fișiere

(Comma Seperated Values)

Redact DOC Fișiere

(Microsoft Word Binary Format)

Redact DOCM Fișiere

(Microsoft Word 2007 Marco File)

Redact DOCX Fișiere

(Office 2007+ Word Document)

Redact DOT Fișiere

(Microsoft Word Template Files)

Redact DOTM Fișiere

(Microsoft Word 2007+ Template File)

Redact DOTX Fișiere

(Microsoft Word Template File )

Redact POT Fișiere

(Microsoft PowerPoint Template Files)

Redact POTM Fișiere

(Microsoft PowerPoint Template File)

Redact PPS Fișiere

(PowerPoint Slide Show)

Redact PPSM Fișiere

(Macro-enabled Slide Show)

Redact PPSX Fișiere

(PowerPoint Slide Show)

Redact PPT Fișiere

(Microsoft PowerPoint 97-2003)

Redact PPTM Fișiere

(Macro-enabled Presentation File)

Redact PPTX Fișiere

(Open XML presentation Format)

Redact RTF Fișiere

(Rich Text Format)

Redact XLS Fișiere

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM Fișiere

(Macro-enabled Spreadsheet)

Redact XLSX Fișiere

(Open XML Workbook)

Redact XLT Fișiere

(Excel 97 - 2003 Template)

Redact XLTM Fișiere

(Excel Macro-Enabled Template)

Redact XLTX Fișiere

(Excel Template)

Back to top
 Română