So entfernen Sie Text aus DOT-Dateien mit regulären Ausdrücken und Java

Mit der Java-API von GroupDocs.Redaction können Sie sensiblen Text aus Textverarbeitungsdokumenten, Arbeitsblättern, Präsentationen, PDFs und Bildern mithilfe regulärer Ausdrücke schwärzen, ausblenden oder entfernen.


Download kostenlose Testversion

Was ist Textbereinigung?

Textschwärzung oder -bereinigung ist der Prozess, bei dem vertrauliche oder unerwünschte Texte oder Informationen aus digitalen Dokumenten entfernt werden, während der Rest des Dokuments oder Absatzes, der sie enthält, intakt bleibt. Redaction hilft Benutzern und Organisationen, ihre sensiblen Informationen zu schützen, indem sie diese verbergen oder dauerhaft entfernen. Mithilfe der GroupDocs.Redaction Java API können Benutzer jetzt vertraulichen Text aus Textverarbeitungsdokumenten, Arbeitsblättern, Präsentationen, PDF und Rasterbilddateien schwärzen, ausblenden oder entfernen. Die API bietet eine Vielzahl von Optionen und Methoden zur Schwärzung privater Informationen in den Dokumenten. Es unterstützt die Suche und Schwärzung mithilfe regulärer Ausdrücke, die Verwendung textueller (Ausnahmecodes) oder grafischer Schwärzungen (farbige Rechtecke) und vieles mehr. Probieren Sie es also einfach aus und automatisieren Sie Ihren Dokument-Schwärzungsprozess, indem Sie die API herunterladen und ihre grundlegenden und erweiterten Funktionen erkunden.

Schwärzen Sie DOT mithilfe regulärer Ausdrücke in Java

GroupDocs.Redaction ermöglicht das einfache Entfernen vertraulicher oder privater Daten aus Ihren Dokumenten. Der häufigste Schwärzungsfall ist das Entfernen eines Textes aus einem Dokument.

Der folgende Code kann verwendet werden, um mithilfe eines regulären Ausdrucks eine Textredaktion auf einen bestimmten Teil eines Dokuments anzuwenden. Es ermöglicht Benutzern, alle Zahlen zu ersetzen und dabei das Muster „AA BB CCCCCC“ durch ein blaues Farbrechteck abzugleichen.

Sensible Daten aus DOT entfernen

  • Erstellen Sie eine Instanz der Klasse Redactor und laden Sie die Datei DOT hoch
  • Erstellen Sie eine Instanz der Klasse RegexRedaction.
  • Rufen Sie die Methode redactor.apply mit dem Objekt der Klasse RegexRedaction auf
  • Rufen Sie die Methode redactor.save auf, um die Änderungen zu speichern


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

System Anforderungen

GroupDocs.Redaction for Java APIs werden auf allen wichtigen Plattformen und Betriebssystemen unterstützt. Den vollständigen Leitfaden zu den Systemanforderungen finden Sie unter Systemanforderungen. Bevor Sie den folgenden Code ausführen, stellen Sie bitte sicher, dass die folgenden Voraussetzungen auf Ihrem System installiert sind :

  • Betriebssysteme: Microsoft Windows, Linux, MacOS
  • Entwicklungsumgebung: NetBeans, Intellij IDEA, Eclipse usw
  • Java Laufzeitumgebung: J2SE 6.0 und höher
  • Holen Sie sich die neueste Version von GroupDocs.Redaction for Java von Maven

Warum GroupDocs.Redaction verwenden?

  • Ermöglichen Sie Benutzern das Hinzufügen benutzerdefinierter Dokumentformate und Schwärzungsarten
  • Zum Entfernen sensibler Informationen ist keine zusätzliche Software erforderlich
  • Möglichkeit, das Seitenbereich-Rendering-Dokument als PDF festzulegen
  • Einfache Möglichkeit, verschiedene Arten von Metadaten zu redigieren: Autorenname, Version, Titel, Betreff, Beschreibung und vieles mehr
  • Extraktion von Dokumentinformationen – Dateityp, Seitenanzahl usw.


What is DOT File Format?

Files with .DOT extension are template files created by Microsoft Word to have pre-formatted settings for generation of further DOC or DOCX files. A template file is created in order to have specific user settings that should be applied to subsequent files created from these. These settings include page margins, borders, headers, footers, and other page settings. Such templates are used in official documents such as company letterheads and standardized forms. The DOT file format is specific to Microsoft Word 2003 and earlier, but is supported by higher versions as well. Microsoft Word by default opens every new document based on normal.dot file. If modified, all the new files created will result in same settings as from the template file. In Microsoft Word 2007, the DOT file format has been replaced with Office OpenXML based DOTX file format.

Read More

Beliebt Redaktion Auswahl

Schwärzen CSV Dateien

(Comma Seperated Values)

Schwärzen DOC Dateien

(Microsoft Word Binary Format)

Schwärzen DOCM Dateien

(Microsoft Word 2007 Marco File)

Schwärzen DOCX Dateien

(Office 2007+ Word Document)

Schwärzen DOTM Dateien

(Microsoft Word 2007+ Template File)

Schwärzen DOTX Dateien

(Microsoft Word Template File )

Schwärzen PDF Dateien

(Portable Document Format)

Schwärzen POT Dateien

(Microsoft PowerPoint Template Files)

Schwärzen POTM Dateien

(Microsoft PowerPoint Template File)

Schwärzen PPS Dateien

(PowerPoint Slide Show)

Schwärzen PPSM Dateien

(Macro-enabled Slide Show)

Schwärzen PPSX Dateien

(PowerPoint Slide Show)

Schwärzen PPT Dateien

(Microsoft PowerPoint 97-2003)

Schwärzen PPTM Dateien

(Macro-enabled Presentation File)

Schwärzen PPTX Dateien

(Open XML presentation Format)

Schwärzen RTF Dateien

(Rich Text Format)

Schwärzen XLS Dateien

(Microsoft Excel Spreadsheet (Legacy))

Schwärzen XLSM Dateien

(Macro-enabled Spreadsheet)

Schwärzen XLSX Dateien

(Open XML Workbook)

Schwärzen XLT Dateien

(Excel 97 - 2003 Template)

Schwärzen XLTM Dateien

(Excel Macro-Enabled Template)

Schwärzen XLTX Dateien

(Excel Template)

Back to top
 Deutsch