Cum să eliminați text din fișierele DOT folosind expresii regulate și Java

API-ul GroupDocs.Redaction Java permite redactarea, ascunderea sau eliminarea textului sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și imagini folosind expresii obișnuite.


Descarcare varianta scurta de prezentare gratuita

Ce este dezinfectarea textului?

Redactarea sau igienizarea textului este procesul de eliminare a textului sau a informațiilor confidențiale sau nedorite din documentele digitale, lăsând intact restul documentului sau al paragrafului care le conține. Redaction ajută utilizatorii, precum și organizația să își protejeze informațiile sensibile, ascunzându-le sau eliminându-le definitiv. Folosind GroupDocs.Redaction Java utilizatorii API-ului pot acum redacta, ascunde sau elimina text sensibil din documente de procesare de text, foi de lucru, prezentări, PDF și fișiere imagine raster. API-ul oferă o gamă largă de opțiuni și metode pentru redactarea informațiilor private din documente. Acceptă căutarea și redactarea folosind expresii regulate, utilizarea redactărilor textuale (coduri de exceptare) sau grafice (dreptunghiuri colorate) și multe altele. Așadar, de ce să nu încercați și să vă automatizați procesul de redactare a documentelor descărcând API-ul și explorați funcțiile sale de bază și avansate.

Redactați DOT folosind expresii regulate în Java

GroupDocs.Redaction permite eliminarea cu ușurință a datelor de natură sensibilă sau privată din documentele dvs. Cel mai popular caz de redactare este eliminarea unui text dintr-un document.

Următorul cod poate fi folosit pentru a aplica redactarea textuală unei anumite părți a unui document folosind expresia regulată. Permite utilizatorilor să înlocuiască toate numerele, potrivirea modelului „AA BB CCCCCC” cu un dreptunghi de culoare albastră,

Eliminați datele sensibile din DOT

  • Creați o instanță a clasei Redactor și încărcați fișierul DOT
  • Creați o instanță a clasei RegexRedaction
  • Apelați metoda redactor.apply cu obiectul clasei RegexRedaction
  • Apelați metoda redactor.save pentru a salva modificările


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Cerințe de sistem

GroupDocs.Redaction for Java API-urile sunt acceptate pe toate platformele și sistemele de operare majore. Pentru ghidul complet al cerințelor de sistem, vă rugăm să vizitați cerințe de sistem Înainte de a executa codul de mai jos, vă rugăm să vă asigurați că aveți următoarele cerințe preliminare instalate pe sistemul dvs. :

  • Sisteme de operare: Microsoft Windows, Linux, MacOS
  • Mediu de dezvoltare: NetBeans, Intellij IDEA, Eclipse etc
  • Java Mediu de rulare: J2SE 6.0 și versiuni ulterioare
  • Obțineți cea mai recentă versiune a GroupDocs.Redaction for Java de la Maven

De ce să folosiți GroupDocs.Redaction

  • Permiteți utilizatorilor să adauge formate de documente personalizate și tipuri de redactări
  • Nu este necesar niciun software suplimentar pentru a elimina informațiile sensibile
  • Posibilitatea de a seta documentul de randare a intervalului de pagini ca PDF
  • O modalitate ușoară de a redacta diferite tipuri de metadate: numele autorului, versiunea, titlul, subiectul, descrierea și multe altele
  • Extragerea informațiilor documentului - tip de fișier, număr de pagini etc.


What is DOT File Format?

Files with .DOT extension are template files created by Microsoft Word to have pre-formatted settings for generation of further DOC or DOCX files. A template file is created in order to have specific user settings that should be applied to subsequent files created from these. These settings include page margins, borders, headers, footers, and other page settings. Such templates are used in official documents such as company letterheads and standardized forms. The DOT file format is specific to Microsoft Word 2003 and earlier, but is supported by higher versions as well. Microsoft Word by default opens every new document based on normal.dot file. If modified, all the new files created will result in same settings as from the template file. In Microsoft Word 2007, the DOT file format has been replaced with Office OpenXML based DOTX file format.

Read More

Popular Redactare Opțiuni

Redact CSV Fișiere

(Comma Seperated Values)

Redact DOC Fișiere

(Microsoft Word Binary Format)

Redact DOCM Fișiere

(Microsoft Word 2007 Marco File)

Redact DOCX Fișiere

(Office 2007+ Word Document)

Redact DOTM Fișiere

(Microsoft Word 2007+ Template File)

Redact DOTX Fișiere

(Microsoft Word Template File )

Redact PDF Fișiere

(Portable Document Format)

Redact POT Fișiere

(Microsoft PowerPoint Template Files)

Redact POTM Fișiere

(Microsoft PowerPoint Template File)

Redact PPS Fișiere

(PowerPoint Slide Show)

Redact PPSM Fișiere

(Macro-enabled Slide Show)

Redact PPSX Fișiere

(PowerPoint Slide Show)

Redact PPT Fișiere

(Microsoft PowerPoint 97-2003)

Redact PPTM Fișiere

(Macro-enabled Presentation File)

Redact PPTX Fișiere

(Open XML presentation Format)

Redact RTF Fișiere

(Rich Text Format)

Redact XLS Fișiere

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM Fișiere

(Macro-enabled Spreadsheet)

Redact XLSX Fișiere

(Open XML Workbook)

Redact XLT Fișiere

(Excel 97 - 2003 Template)

Redact XLTM Fișiere

(Excel Macro-Enabled Template)

Redact XLTX Fișiere

(Excel Template)

Back to top
 Română