Tekst verwijderen uit DOT-bestanden met reguliere expressies en Java

Met de Java-API van GroupDocs.Redaction kunt u gevoelige tekst redigeren, verbergen of verwijderen uit tekstverwerkingsdocumenten, werkbladen, presentaties, PDFs en afbeeldingen met behulp van reguliere expressies.


Download gratis proefversie

Wat is tekstopschoning?

Tekstredactie of opschoning is het proces waarbij de vertrouwelijke of ongewenste tekst of informatie uit digitale documenten wordt verwijderd, terwijl de rest van het document of de alinea die het bevat intact blijft. Redactie helpt zowel gebruikers als organisaties om hun gevoelige informatie te beschermen door ze te verbergen of permanent te verwijderen. Met GroupDocs.Redaction Java API kunnen gebruikers nu gevoelige tekst redigeren, verbergen of verwijderen uit tekstverwerkingsdocumenten, werkbladen, presentaties, PDF en rasterafbeeldingsbestanden. De API biedt een breed scala aan opties en methoden voor het redigeren van privé-informatie in de documenten. Het ondersteunt zoeken en redigeren met behulp van reguliere expressies, het gebruik van tekstuele (vrijstellingscodes) of grafische (gekleurde rechthoeken) redacties en nog veel meer. Dus waarom zou u het niet eens proberen en uw documentredactieproces automatiseren door de API te downloaden en de basis- en geavanceerde functies ervan te verkennen.

Bewerk DOT met reguliere expressies in Java

Met GroupDocs.Redaction kunt u eenvoudig gegevens van gevoelige of privé-aard uit uw documenten verwijderen. De meest populaire redactioneel geval is het verwijderen van een tekst uit een document.

De volgende code kan worden gebruikt om tekstredactie toe te passen op een bepaald deel van een document met behulp van reguliere expressies. Hiermee kunnen gebruikers alle nummers vervangen, passend patroon “AA BB CCCCCC” met een blauwe kleurrechthoek,

Gevoelige gegevens verwijderen uit DOT

  • Maak een instantie van de klasse Redactor en upload DOT-bestand
  • Maak een instantie van de klasse RegexRedaction
  • Roep de methode redactor.apply aan met het object van de klasse RegexRedaction
  • Roep de methode redactor.save aan om de wijzigingen op te slaan


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

systeem vereisten

GroupDocs.Redaction for Java API’s worden ondersteund op alle belangrijke platforms en besturingssystemen. Ga voor de volledige gids met systeemvereisten naar systeemvereisten Voordat u de onderstaande code uitvoert, moet u ervoor zorgen dat de volgende vereisten op uw systeem zijn geïnstalleerd :

  • Besturingssystemen: Microsoft Windows, Linux, MacOS
  • Ontwikkelomgeving: NetBeans, Intellij IDEA, Eclipse etc
  • Java Runtime-omgeving: J2SE 6.0 en hoger
  • Download de nieuwste versie van GroupDocs.Redaction for Java van Maven

Waarom GroupDocs.Redaction gebruiken

  • Sta gebruikers toe om aangepaste documentindelingen en soorten redacties toe te voegen
  • Er is geen extra software nodig om gevoelige informatie te verwijderen
  • Mogelijkheid om het weergavedocument voor het paginabereik in te stellen als PDF
  • Gemakkelijke manier om verschillende soorten metadata te redigeren: auteursnaam, versie, titel, onderwerp, beschrijving en nog veel meer
  • Extractie van documentinformatie - bestandstype, aantal pagina’s enz.


What is DOT File Format?

Files with .DOT extension are template files created by Microsoft Word to have pre-formatted settings for generation of further DOC or DOCX files. A template file is created in order to have specific user settings that should be applied to subsequent files created from these. These settings include page margins, borders, headers, footers, and other page settings. Such templates are used in official documents such as company letterheads and standardized forms. The DOT file format is specific to Microsoft Word 2003 and earlier, but is supported by higher versions as well. Microsoft Word by default opens every new document based on normal.dot file. If modified, all the new files created will result in same settings as from the template file. In Microsoft Word 2007, the DOT file format has been replaced with Office OpenXML based DOTX file format.

Read More

Populair Redactie Opties

Redact CSV Bestanden

(Comma Seperated Values)

Redact DOC Bestanden

(Microsoft Word Binary Format)

Redact DOCM Bestanden

(Microsoft Word 2007 Marco File)

Redact DOCX Bestanden

(Office 2007+ Word Document)

Redact DOTM Bestanden

(Microsoft Word 2007+ Template File)

Redact DOTX Bestanden

(Microsoft Word Template File )

Redact PDF Bestanden

(Portable Document Format)

Redact POT Bestanden

(Microsoft PowerPoint Template Files)

Redact POTM Bestanden

(Microsoft PowerPoint Template File)

Redact PPS Bestanden

(PowerPoint Slide Show)

Redact PPSM Bestanden

(Macro-enabled Slide Show)

Redact PPSX Bestanden

(PowerPoint Slide Show)

Redact PPT Bestanden

(Microsoft PowerPoint 97-2003)

Redact PPTM Bestanden

(Macro-enabled Presentation File)

Redact PPTX Bestanden

(Open XML presentation Format)

Redact RTF Bestanden

(Rich Text Format)

Redact XLS Bestanden

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM Bestanden

(Macro-enabled Spreadsheet)

Redact XLSX Bestanden

(Open XML Workbook)

Redact XLT Bestanden

(Excel 97 - 2003 Template)

Redact XLTM Bestanden

(Excel Macro-Enabled Template)

Redact XLTX Bestanden

(Excel Template)

Back to top
 Nederlands