Kā noņemt tekstu no RTF failiem, izmantojot regulārās izteiksmes un Java

GroupDocs.Redactions Java API ļauj rediģēt, paslēpt vai noņemt sensitīvu tekstu no tekstapstrādes dokumentiem, darblapām, prezentācijām, PDFs un attēliem, izmantojot regulārās izteiksmes.


Lejupielādējiet bezmaksas izmēģinājumu

Kas ir teksta dezinfekcija?

Teksta rediģēšana vai attīrīšana ir process, kurā no digitālajiem dokumentiem tiek noņemts konfidenciāls vai nevēlams teksts vai informācija, vienlaikus atstājot neskartu pārējo dokumenta daļu vai rindkopu, kurā tas ir. Rediģēšana palīdz lietotājiem, kā arī organizācijai aizsargāt viņu sensitīvo informāciju, paslēpjot vai neatgriezeniski noņemot to. Izmantojot GroupDocs.Redaction Java API, lietotāji tagad var rediģēt, paslēpt vai noņemt sensitīvu tekstu no tekstapstrādes dokumentiem, darblapām, prezentācijām, PDF un rastra attēlu failiem. API nodrošina plašas iespējas un metodes dokumentos esošās privātās informācijas rediģēšanai. Tā atbalsta meklēšanu un rediģēšanu, izmantojot regulāras izteiksmes, teksta (atbrīvojuma kodi) vai grafisko (krāsaini taisnstūri) rediģēšanu un daudz ko citu. Tātad, kāpēc gan neizmēģināt un automatizēt dokumentu rediģēšanas procesu, lejupielādējot API un izpētot tā pamata un papildu funkcijas.

Rediģēt RTF, izmantojot regulārās izteiksmes pakalpojumā Java

GroupDocs.Redaction ļauj viegli noņemt sensitīvus vai privātus datus no jūsu dokumentiem. Populārākais rediģēšanas gadījums ir teksta noņemšana no dokumenta.

Šo kodu var izmantot, lai lietotu teksta rediģēšanu noteiktai dokumenta daļai, izmantojot regulāro izteiksmi. Tas ļauj lietotājiem aizstāt visus skaitļus, saskaņojot modeli “AA BB CCCCCC” ar zilu taisnstūri,

Noņemt sensitīvos datus no RTF

  • Izveidojiet klases Redactor gadījumu un augšupielādējiet RTF failu
  • Izveidojiet klases RegexRedaction gadījumu
  • Izsauciet metodi redactor.apply ar RegexRedaction klases objektu
  • Lai saglabātu izmaiņas, izsauciet metodi redactor.save


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Sistēmas prasības

GroupDocs.Redaction for Java API tiek atbalstītas visās lielākajās platformās un operētājsistēmās. Lai iegūtu pilnu sistēmas prasību rokasgrāmatu, lūdzu, apmeklējiet sistēmas prasības Pirms tālāk norādītā koda izpildes, lūdzu, pārliecinieties, vai jūsu sistēmā ir instalēti tālāk norādītie priekšnosacījumi. :

  • Operētājsistēmas: Microsoft Windows, Linux, MacOS
  • Izstrādes vide: NetBeans, Intellij IDEA, Eclipse utt
  • Java Izpildlaika vide: J2SE 6.0 un jaunāka versija
  • Iegūstiet jaunāko GroupDocs.Redaction for Java versiju no Maven

Kāpēc izmantot GroupDocs.Redaction

  • Ļaujiet lietotājiem pievienot pielāgotus dokumentu formātus un labojumu veidus
  • Sensitīvas informācijas noņemšanai nav nepieciešama papildu programmatūra
  • Iespēja iestatīt lapu diapazona renderēšanas dokumentu kā PDF
  • Vienkāršs veids, kā rediģēt dažāda veida metadatus: autora vārdu, versiju, nosaukumu, tēmu, aprakstu un daudz ko citu
  • Dokumentu informācijas izvilkšana - faila tips, lappušu skaits utt.


What is RTF File Format?

Introduced and documented by Microsoft, the Rich Text Format (RTF) represents a method of encoding formatted text and graphics for use within applications. The format facilitates cross-platform document exchange with other Microsoft Products, thus serving the purpose of interoperability. This capability makes it a standard of data transfer between word processing software and, hence, contents can be transferred from one operating system to another without losing document formatting. The file format specifications are available by Microsoft for public download and can be referred to from developer’s perspective.

Read More

Populārs Redakcija Iespējas

REDACT CSV Faili

(Comma Seperated Values)

REDACT DOC Faili

(Microsoft Word Binary Format)

REDACT DOCM Faili

(Microsoft Word 2007 Marco File)

REDACT DOCX Faili

(Office 2007+ Word Document)

REDACT DOT Faili

(Microsoft Word Template Files)

REDACT DOTM Faili

(Microsoft Word 2007+ Template File)

REDACT DOTX Faili

(Microsoft Word Template File )

REDACT PDF Faili

(Portable Document Format)

REDACT POT Faili

(Microsoft PowerPoint Template Files)

REDACT POTM Faili

(Microsoft PowerPoint Template File)

REDACT PPS Faili

(PowerPoint Slide Show)

REDACT PPSM Faili

(Macro-enabled Slide Show)

REDACT PPSX Faili

(PowerPoint Slide Show)

REDACT PPT Faili

(Microsoft PowerPoint 97-2003)

REDACT PPTM Faili

(Macro-enabled Presentation File)

REDACT PPTX Faili

(Open XML presentation Format)

REDACT XLS Faili

(Microsoft Excel Spreadsheet (Legacy))

REDACT XLSM Faili

(Macro-enabled Spreadsheet)

REDACT XLSX Faili

(Open XML Workbook)

REDACT XLT Faili

(Excel 97 - 2003 Template)

REDACT XLTM Faili

(Excel Macro-Enabled Template)

REDACT XLTX Faili

(Excel Template)

Back to top
 Latviešu