Tekst verwijderen uit PDF-bestanden met reguliere expressies en Java

Met de Java-API van GroupDocs.Redaction kunt u gevoelige tekst redigeren, verbergen of verwijderen uit tekstverwerkingsdocumenten, werkbladen, presentaties, PDFs en afbeeldingen met behulp van reguliere expressies.


Download gratis proefversie

Wat is tekstopschoning?

Tekstredactie of opschoning is het proces waarbij de vertrouwelijke of ongewenste tekst of informatie uit digitale documenten wordt verwijderd, terwijl de rest van het document of de alinea die het bevat intact blijft. Redactie helpt zowel gebruikers als organisaties om hun gevoelige informatie te beschermen door ze te verbergen of permanent te verwijderen. Met GroupDocs.Redaction Java API kunnen gebruikers nu gevoelige tekst redigeren, verbergen of verwijderen uit tekstverwerkingsdocumenten, werkbladen, presentaties, PDF en rasterafbeeldingsbestanden. De API biedt een breed scala aan opties en methoden voor het redigeren van privé-informatie in de documenten. Het ondersteunt zoeken en redigeren met behulp van reguliere expressies, het gebruik van tekstuele (vrijstellingscodes) of grafische (gekleurde rechthoeken) redacties en nog veel meer. Dus waarom zou u het niet eens proberen en uw documentredactieproces automatiseren door de API te downloaden en de basis- en geavanceerde functies ervan te verkennen.

Bewerk PDF met reguliere expressies in Java

Met GroupDocs.Redaction kunt u eenvoudig gegevens van gevoelige of privé-aard uit uw documenten verwijderen. De meest populaire redactioneel geval is het verwijderen van een tekst uit een document.

De volgende code kan worden gebruikt om tekstredactie toe te passen op een bepaald deel van een document met behulp van reguliere expressies. Hiermee kunnen gebruikers alle nummers vervangen, passend patroon “AA BB CCCCCC” met een blauwe kleurrechthoek,

Gevoelige gegevens verwijderen uit PDF

  • Maak een instantie van de klasse Redactor en upload PDF-bestand
  • Maak een instantie van de klasse RegexRedaction
  • Roep de methode redactor.apply aan met het object van de klasse RegexRedaction
  • Roep de methode redactor.save aan om de wijzigingen op te slaan


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

systeem vereisten

GroupDocs.Redaction for Java API’s worden ondersteund op alle belangrijke platforms en besturingssystemen. Ga voor de volledige gids met systeemvereisten naar systeemvereisten Voordat u de onderstaande code uitvoert, moet u ervoor zorgen dat de volgende vereisten op uw systeem zijn geïnstalleerd :

  • Besturingssystemen: Microsoft Windows, Linux, MacOS
  • Ontwikkelomgeving: NetBeans, Intellij IDEA, Eclipse etc
  • Java Runtime-omgeving: J2SE 6.0 en hoger
  • Download de nieuwste versie van GroupDocs.Redaction for Java van Maven

Waarom GroupDocs.Redaction gebruiken

  • Sta gebruikers toe om aangepaste documentindelingen en soorten redacties toe te voegen
  • Er is geen extra software nodig om gevoelige informatie te verwijderen
  • Mogelijkheid om het weergavedocument voor het paginabereik in te stellen als PDF
  • Gemakkelijke manier om verschillende soorten metadata te redigeren: auteursnaam, versie, titel, onderwerp, beschrijving en nog veel meer
  • Extractie van documentinformatie - bestandstype, aantal pagina’s enz.


What is PDF File Format?

Portable Document Format (PDF) is a type of document created by Adobe back in 1990s. The purpose of this file format was to introduce a standard for representation of documents and other reference material in a format that is independent of application software, hardware as well as Operating System. PDF files can be opened in Adobe Acrobat Reader/Writer as well in most modern browsers like Chrome, Safari, Firefox via extensions/plug-ins. Most of the commercially available software suites also offer conversion of their documents to PDF file format without the requirement of any additional software component.

Read More

Populair Redactie Opties

Redact CSV Bestanden

(Comma Seperated Values)

Redact DOC Bestanden

(Microsoft Word Binary Format)

Redact DOCM Bestanden

(Microsoft Word 2007 Marco File)

Redact DOCX Bestanden

(Office 2007+ Word Document)

Redact DOT Bestanden

(Microsoft Word Template Files)

Redact DOTM Bestanden

(Microsoft Word 2007+ Template File)

Redact DOTX Bestanden

(Microsoft Word Template File )

Redact POT Bestanden

(Microsoft PowerPoint Template Files)

Redact POTM Bestanden

(Microsoft PowerPoint Template File)

Redact PPS Bestanden

(PowerPoint Slide Show)

Redact PPSM Bestanden

(Macro-enabled Slide Show)

Redact PPSX Bestanden

(PowerPoint Slide Show)

Redact PPT Bestanden

(Microsoft PowerPoint 97-2003)

Redact PPTM Bestanden

(Macro-enabled Presentation File)

Redact PPTX Bestanden

(Open XML presentation Format)

Redact RTF Bestanden

(Rich Text Format)

Redact XLS Bestanden

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM Bestanden

(Macro-enabled Spreadsheet)

Redact XLSX Bestanden

(Open XML Workbook)

Redact XLT Bestanden

(Excel 97 - 2003 Template)

Redact XLTM Bestanden

(Excel Macro-Enabled Template)

Redact XLTX Bestanden

(Excel Template)

Back to top
 Nederlands