Kā noņemt tekstu no DOC failiem, izmantojot regulārās izteiksmes un Java

GroupDocs.Redactions Java API ļauj rediģēt, paslēpt vai noņemt sensitīvu tekstu no tekstapstrādes dokumentiem, darblapām, prezentācijām, PDFs un attēliem, izmantojot regulārās izteiksmes.


Lejupielādējiet bezmaksas izmēģinājumu

Kas ir teksta dezinfekcija?

Teksta rediģēšana vai attīrīšana ir process, kurā no digitālajiem dokumentiem tiek noņemts konfidenciāls vai nevēlams teksts vai informācija, vienlaikus atstājot neskartu pārējo dokumenta daļu vai rindkopu, kurā tas ir. Rediģēšana palīdz lietotājiem, kā arī organizācijai aizsargāt viņu sensitīvo informāciju, paslēpjot vai neatgriezeniski noņemot to. Izmantojot GroupDocs.Redaction Java API, lietotāji tagad var rediģēt, paslēpt vai noņemt sensitīvu tekstu no tekstapstrādes dokumentiem, darblapām, prezentācijām, PDF un rastra attēlu failiem. API nodrošina plašas iespējas un metodes dokumentos esošās privātās informācijas rediģēšanai. Tā atbalsta meklēšanu un rediģēšanu, izmantojot regulāras izteiksmes, teksta (atbrīvojuma kodi) vai grafisko (krāsaini taisnstūri) rediģēšanu un daudz ko citu. Tātad, kāpēc gan neizmēģināt un automatizēt dokumentu rediģēšanas procesu, lejupielādējot API un izpētot tā pamata un papildu funkcijas.

Rediģēt DOC, izmantojot regulārās izteiksmes pakalpojumā Java

GroupDocs.Redaction ļauj viegli noņemt sensitīvus vai privātus datus no jūsu dokumentiem. Populārākais rediģēšanas gadījums ir teksta noņemšana no dokumenta.

Šo kodu var izmantot, lai lietotu teksta rediģēšanu noteiktai dokumenta daļai, izmantojot regulāro izteiksmi. Tas ļauj lietotājiem aizstāt visus skaitļus, saskaņojot modeli “AA BB CCCCCC” ar zilu taisnstūri,

Noņemt sensitīvos datus no DOC

  • Izveidojiet klases Redactor gadījumu un augšupielādējiet DOC failu
  • Izveidojiet klases RegexRedaction gadījumu
  • Izsauciet metodi redactor.apply ar RegexRedaction klases objektu
  • Lai saglabātu izmaiņas, izsauciet metodi redactor.save


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Sistēmas prasības

GroupDocs.Redaction for Java API tiek atbalstītas visās lielākajās platformās un operētājsistēmās. Lai iegūtu pilnu sistēmas prasību rokasgrāmatu, lūdzu, apmeklējiet sistēmas prasības Pirms tālāk norādītā koda izpildes, lūdzu, pārliecinieties, vai jūsu sistēmā ir instalēti tālāk norādītie priekšnosacījumi. :

  • Operētājsistēmas: Microsoft Windows, Linux, MacOS
  • Izstrādes vide: NetBeans, Intellij IDEA, Eclipse utt
  • Java Izpildlaika vide: J2SE 6.0 un jaunāka versija
  • Iegūstiet jaunāko GroupDocs.Redaction for Java versiju no Maven

Kāpēc izmantot GroupDocs.Redaction

  • Ļaujiet lietotājiem pievienot pielāgotus dokumentu formātus un labojumu veidus
  • Sensitīvas informācijas noņemšanai nav nepieciešama papildu programmatūra
  • Iespēja iestatīt lapu diapazona renderēšanas dokumentu kā PDF
  • Vienkāršs veids, kā rediģēt dažāda veida metadatus: autora vārdu, versiju, nosaukumu, tēmu, aprakstu un daudz ko citu
  • Dokumentu informācijas izvilkšana - faila tips, lappušu skaits utt.


What is DOC File Format?

Files with .doc extension represent documents generated by Microsoft Word or other word processing documents in binary file format. The extension was initially used for plain text documentation on several different operating systems. It can contain several different types of data such as images, formatted as well as plain text, graphs, charts, embedded objects, links, pages, page formatting, print settings and a lot others.

Read More

Populārs Redakcija Iespējas

REDACT CSV Faili

(Comma Seperated Values)

REDACT DOCM Faili

(Microsoft Word 2007 Marco File)

REDACT DOCX Faili

(Office 2007+ Word Document)

REDACT DOT Faili

(Microsoft Word Template Files)

REDACT DOTM Faili

(Microsoft Word 2007+ Template File)

REDACT DOTX Faili

(Microsoft Word Template File )

REDACT PDF Faili

(Portable Document Format)

REDACT POT Faili

(Microsoft PowerPoint Template Files)

REDACT POTM Faili

(Microsoft PowerPoint Template File)

REDACT PPS Faili

(PowerPoint Slide Show)

REDACT PPSM Faili

(Macro-enabled Slide Show)

REDACT PPSX Faili

(PowerPoint Slide Show)

REDACT PPT Faili

(Microsoft PowerPoint 97-2003)

REDACT PPTM Faili

(Macro-enabled Presentation File)

REDACT PPTX Faili

(Open XML presentation Format)

REDACT RTF Faili

(Rich Text Format)

REDACT XLS Faili

(Microsoft Excel Spreadsheet (Legacy))

REDACT XLSM Faili

(Macro-enabled Spreadsheet)

REDACT XLSX Faili

(Open XML Workbook)

REDACT XLT Faili

(Excel 97 - 2003 Template)

REDACT XLTM Faili

(Excel Macro-Enabled Template)

REDACT XLTX Faili

(Excel Template)

Back to top
 Latviešu