Cum să eliminați text din fișierele DOCM folosind expresii regulate și Java

API-ul GroupDocs.Redaction Java permite redactarea, ascunderea sau eliminarea textului sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și imagini folosind expresii obișnuite.


Descarcare varianta scurta de prezentare gratuita

Ce este dezinfectarea textului?

Redactarea sau igienizarea textului este procesul de eliminare a textului sau a informațiilor confidențiale sau nedorite din documentele digitale, lăsând intact restul documentului sau al paragrafului care le conține. Redaction ajută utilizatorii, precum și organizația să își protejeze informațiile sensibile, ascunzându-le sau eliminându-le definitiv. Folosind GroupDocs.Redaction Java utilizatorii API-ului pot acum redacta, ascunde sau elimina text sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și fișiere imagine raster. API-ul oferă o gamă largă de opțiuni și metode pentru redactarea informațiilor private din documente. Acceptă căutarea și redactarea folosind expresii regulate, utilizarea redactărilor textuale (coduri de exceptare) sau grafice (dreptunghiuri colorate) și multe altele. Așadar, de ce să nu încercați și să vă automatizați procesul de redactare a documentelor descărcând API-ul și explorați funcțiile sale de bază și avansate.

Redactați DOCM folosind expresii regulate în Java

GroupDocs.Redaction permite eliminarea cu ușurință a datelor de natură sensibilă sau privată din documentele dvs. Cel mai popular caz de redactare este eliminarea unui text dintr-un document.

Următorul cod poate fi folosit pentru a aplica redactarea textuală unei anumite părți a unui document folosind expresia regulată. Permite utilizatorilor să înlocuiască toate numerele, potrivirea modelului „AA BB CCCCCC” cu un dreptunghi de culoare albastră,

Eliminați datele sensibile din DOCM

  • Creați o instanță a clasei Redactor și încărcați fișierul DOCM
  • Creați o instanță a clasei RegexRedaction
  • Apelați metoda redactor.apply cu obiectul clasei RegexRedaction
  • Apelați metoda redactor.save pentru a salva modificările


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Cerințe de sistem

GroupDocs.Redaction for Java API-urile sunt acceptate pe toate platformele și sistemele de operare majore. Pentru ghidul complet al cerințelor de sistem, vă rugăm să vizitați cerințe de sistem Înainte de a executa codul de mai jos, vă rugăm să vă asigurați că aveți următoarele cerințe preliminare instalate pe sistemul dvs. :

  • Sisteme de operare: Microsoft Windows, Linux, MacOS
  • Mediu de dezvoltare: NetBeans, Intellij IDEA, Eclipse etc
  • Java Mediu de rulare: J2SE 6.0 și versiuni ulterioare
  • Obțineți cea mai recentă versiune a GroupDocs.Redaction for Java de la Maven

De ce să folosiți GroupDocs.Redaction

  • Permiteți utilizatorilor să adauge formate de documente personalizate și tipuri de redactări
  • Nu este necesar niciun software suplimentar pentru a elimina informațiile sensibile
  • Posibilitatea de a seta documentul de randare a intervalului de pagini ca PDF
  • O modalitate ușoară de a redacta diferite tipuri de metadate: numele autorului, versiunea, titlul, subiectul, descrierea și multe altele
  • Extragerea informațiilor documentului - tip de fișier, număr de pagini etc.


What is DOCM File Format?

DOCM files are Microsoft Word 2007 or higher generated documents with the ability to run macros. It is similar to DOCX file format but the ability to run macros makes it different from DOCX. Like DOCX, DOCM files can be store text, images, tables, shapes, charts and other contents.The capability to run macros make it easy to save time by executing the series of commands in the form of recorded actions for automatic completion of a task. DOCM files can be opened and edited in Microsoft Word 2007 and above.

Read More

Popular Redactare Opțiuni

Redact CSV Fișiere

(Comma Seperated Values)

Redact DOC Fișiere

(Microsoft Word Binary Format)

Redact DOCX Fișiere

(Office 2007+ Word Document)

Redact DOT Fișiere

(Microsoft Word Template Files)

Redact DOTM Fișiere

(Microsoft Word 2007+ Template File)

Redact DOTX Fișiere

(Microsoft Word Template File )

Redact PDF Fișiere

(Portable Document Format)

Redact POT Fișiere

(Microsoft PowerPoint Template Files)

Redact POTM Fișiere

(Microsoft PowerPoint Template File)

Redact PPS Fișiere

(PowerPoint Slide Show)

Redact PPSM Fișiere

(Macro-enabled Slide Show)

Redact PPSX Fișiere

(PowerPoint Slide Show)

Redact PPT Fișiere

(Microsoft PowerPoint 97-2003)

Redact PPTM Fișiere

(Macro-enabled Presentation File)

Redact PPTX Fișiere

(Open XML presentation Format)

Redact RTF Fișiere

(Rich Text Format)

Redact XLS Fișiere

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM Fișiere

(Macro-enabled Spreadsheet)

Redact XLSX Fișiere

(Open XML Workbook)

Redact XLT Fișiere

(Excel 97 - 2003 Template)

Redact XLTM Fișiere

(Excel Macro-Enabled Template)

Redact XLTX Fișiere

(Excel Template)

Back to top
 Română