Cara Menghapus Teks dari File DOT menggunakan Ekspresi Reguler dan Java

GroupDocs.RedactionJava API memungkinkan untuk menyunting, menyembunyikan, atau menghapus teks sensitif dari dokumen pemrosesan kata, lembar kerja, presentasi, PDF & gambar menggunakan ekspresi reguler.


Unduh Uji Coba Gratis

Apa itu Sanitasi Teks?

Redaksi atau Sanitasi Teks adalah proses menghapus teks atau informasi rahasia atau tidak diinginkan dari dokumen digital sambil membiarkan sisa dokumen atau paragraf yang memuatnya tetap utuh. Redaksi membantu pengguna serta organisasi untuk melindungi informasi sensitif mereka dengan menyembunyikan atau menghapusnya secara permanen. Dengan menggunakan GroupDocs.Redaction Java pengguna API kini dapat menyunting, menyembunyikan, atau menghapus teks sensitif dari dokumen pemrosesan kata, lembar kerja, presentasi, PDF, dan file gambar raster. API menyediakan berbagai opsi dan metode untuk redaksi informasi pribadi dalam dokumen. Ini mendukung pencarian dan penyuntingan menggunakan ekspresi reguler, penggunaan penyuntingan tekstual (kode pengecualian) atau grafis (persegi panjang berwarna) dan banyak lagi. Jadi mengapa tidak mencobanya dan mengotomatiskan proses penyuntingan dokumen Anda dengan mengunduh API dan menjelajahi fitur dasar dan lanjutannya.

Redact DOT menggunakan Regular Expressions di Java

GroupDocs.Redaction memungkinkan untuk menyunting data sensitif atau pribadi dengan mudah dari dokumen Anda. Kasus redaksi paling populer adalah menghapus teks dari dokumen.

Kode berikut dapat digunakan untuk menerapkan redaksi tekstual ke bagian tertentu dari dokumen menggunakan ekspresi reguler. Ini memungkinkan pengguna untuk mengganti semua angka, mencocokkan pola “AA BB CCCCCC” dengan kotak warna Biru,

Hapus Data Sensitif dari DOT

  • Buat instance kelas Redactor & upload DOT file
  • Buat instance kelas RegexRedaction
  • Panggil metode redactor.apply dengan objek kelas RegexRedaction
  • Panggil metode redactor.save untuk menyimpan perubahan


// For complete examples and data files, please go to https://github.com/groupdocs-search/GroupDocs.Redaction-for-Java
//Load document
Document doc = Redactor.load(Utilities.mapSourceFilePath(FilePath));
// Perform regular expression redaction
doc.redactWith(new RegexRedaction("\\d{2}\\s*\\d{2}[^\\d]*\\d{6}", new ReplacementOptions(java.awt.Color.BLUE)));
// Save the document in original format and overwriting original file
SaveOptions so = new SaveOptions();
so.setAddSuffix(false);
so.setRasterizeToPDF(false);
doc.save(so);
doc.close();

Persyaratan sistem

GroupDocs.Redaction for Java API didukung di semua platform dan sistem operasi utama. Untuk panduan persyaratan sistem lengkap, silakan kunjungi persyaratan sistem Sebelum menjalankan kode di bawah ini, pastikan Anda telah menginstal prasyarat berikut di sistem Anda :

  • Sistem Operasi: Microsoft Windows, Linux, MacOS
  • Lingkungan Pengembangan: NetBeans, Intellij IDEA, Eclipse dll
  • Java Lingkungan Waktu Proses: J2SE 6.0 dan yang lebih baru
  • Dapatkan versi terbaru GroupDocs.Redaction for Java dari Maven

Mengapa Menggunakan GroupDocs.Redaction

  • Izinkan pengguna untuk menambahkan format dokumen khusus dan jenis penyuntingan
  • Tidak diperlukan perangkat lunak tambahan untuk menghapus informasi sensitif
  • Kemampuan untuk menyetel dokumen rendering rentang halaman sebagai PDF
  • Cara mudah untuk menyunting berbagai jenis metadata: nama penulis, versi, judul, subjek, deskripsi, dan banyak lagi
  • Ekstraksi informasi dokumen - jenis file, jumlah halaman, dll.


What is DOT File Format?

Files with .DOT extension are template files created by Microsoft Word to have pre-formatted settings for generation of further DOC or DOCX files. A template file is created in order to have specific user settings that should be applied to subsequent files created from these. These settings include page margins, borders, headers, footers, and other page settings. Such templates are used in official documents such as company letterheads and standardized forms. The DOT file format is specific to Microsoft Word 2003 and earlier, but is supported by higher versions as well. Microsoft Word by default opens every new document based on normal.dot file. If modified, all the new files created will result in same settings as from the template file. In Microsoft Word 2007, the DOT file format has been replaced with Office OpenXML based DOTX file format.

Read More

Populer Redaksi Pilihan

Redaksi CSV File

(Comma Seperated Values)

Redaksi DOC File

(Microsoft Word Binary Format)

Redaksi DOCM File

(Microsoft Word 2007 Marco File)

Redaksi DOCX File

(Office 2007+ Word Document)

Redaksi DOTM File

(Microsoft Word 2007+ Template File)

Redaksi DOTX File

(Microsoft Word Template File )

Redaksi PDF File

(Portable Document Format)

Redaksi POT File

(Microsoft PowerPoint Template Files)

Redaksi POTM File

(Microsoft PowerPoint Template File)

Redaksi PPS File

(PowerPoint Slide Show)

Redaksi PPSM File

(Macro-enabled Slide Show)

Redaksi PPSX File

(PowerPoint Slide Show)

Redaksi PPT File

(Microsoft PowerPoint 97-2003)

Redaksi PPTM File

(Macro-enabled Presentation File)

Redaksi PPTX File

(Open XML presentation Format)

Redaksi RTF File

(Rich Text Format)

Redaksi XLS File

(Microsoft Excel Spreadsheet (Legacy))

Redaksi XLSM File

(Macro-enabled Spreadsheet)

Redaksi XLSX File

(Open XML Workbook)

Redaksi XLT File

(Excel 97 - 2003 Template)

Redaksi XLTM File

(Excel Macro-Enabled Template)

Redaksi XLTX File

(Excel Template)

Back to top
 Indonesian