रेगुलर एक्सप्रेशन और Java का उपयोग करके DOCX फ़ाइलों से टेक्स्ट कैसे हटाएं

GroupDocs.Redaction की Java एपीआई नियमित अभिव्यक्तियों का उपयोग करके वर्ड प्रोसेसिंग दस्तावेजों, वर्कशीट, प्रस्तुतियों, PDF और छवियों से संवेदनशील पाठ को संशोधित करने, छिपाने या हटाने की अनुमति देती है।


नि: शुल्क परीक्षण डाउनलोड करें

टेक्स्ट सेनिटाइजेशन क्या है?

टेक्स्ट रिडेक्शन या सेनिटाइजेशन डिजिटल दस्तावेज़ों से गोपनीय या अवांछित पाठ या जानकारी को हटाने की प्रक्रिया है, जबकि इसमें मौजूद दस्तावेज़ या पैराग्राफ के बाकी हिस्सों को बरकरार रखा जाता है। रिडक्शन उपयोगकर्ताओं के साथ-साथ संगठन को उनकी संवेदनशील जानकारी को छुपाकर या स्थायी रूप से हटाकर सुरक्षित रखने में मदद करता है। GroupDocs.Redaction Java एपीआई का उपयोग करके उपयोगकर्ता अब वर्ड प्रोसेसिंग दस्तावेज़ों, कार्यपत्रकों, प्रस्तुतियों, PDF और रास्टर छवि फ़ाइलों से संवेदनशील पाठ को संपादित, छिपा या हटा सकते हैं। एपीआई दस्तावेजों में निजी जानकारी के संशोधन के लिए विकल्पों और तरीकों की एक विस्तृत श्रृंखला प्रदान करता है। यह नियमित अभिव्यक्तियों, पाठ्य (छूट कोड) या ग्राफिकल (रंगीन आयत) संपादनों के उपयोग और कई अन्य चीजों का उपयोग करके खोज और संपादन का समर्थन करता है। तो क्यों न इसे आज़माएं और एपीआई डाउनलोड करके अपने दस्तावेज़ संशोधन प्रक्रिया को स्वचालित करें और इसकी बुनियादी और उन्नत सुविधाओं का पता लगाएं।

Java में रेगुलर एक्सप्रेशन का उपयोग करके DOCX को संशोधित करें

GroupDocs.Redaction आपके दस्तावेज़ों से संवेदनशील या निजी प्रकृति के डेटा को आसानी से संशोधित करने की अनुमति देता है। सबसे लोकप्रिय संशोधन मामला किसी दस्तावेज़ से किसी पाठ को हटाना है।

नियमित अभिव्यक्ति का उपयोग करके किसी दस्तावेज़ के किसी विशेष भाग में पाठ्य संपादन लागू करने के लिए निम्नलिखित कोड का उपयोग किया जा सकता है। यह उपयोगकर्ताओं को “AA BB CCCCCC” से मेल खाते सभी नंबरों को नीले रंग के आयत से बदलने की अनुमति देता है।

DOCX से संवेदनशील डेटा हटाएँ

  • Redactor क्लास का एक उदाहरण बनाएं और DOCX फ़ाइल अपलोड करें
  • RegexRedaction क्लास का एक उदाहरण बनाएं
  • RegexRedaction क्लास के ऑब्जेक्ट के साथ redactor.apply विधि को कॉल करें
  • परिवर्तनों को सहेजने के लिए redactor.save विधि को कॉल करें


सिस्टम आवश्यकताएं

GroupDocs.Redaction for Java एपीआई सभी प्रमुख प्लेटफार्मों और ऑपरेटिंग सिस्टम पर समर्थित हैं। संपूर्ण सिस्टम आवश्यकता मार्गदर्शिका के लिए, कृपया सिस्टम आवश्यकताएं पर जाएं। नीचे दिए गए कोड को निष्पादित करने से पहले, कृपया सुनिश्चित करें कि आपके सिस्टम पर निम्नलिखित आवश्यक शर्तें इंस्टॉल हैं। :

  • ऑपरेटिंग सिस्टम: माइक्रोसॉफ्ट Windows, Linux, Macओएस
  • विकास पर्यावरण: नेटबीन्स, इंटेलीज आईडीईए, एक्लिप्स आदि
  • Java रनटाइम वातावरण: J2SE 6.0 और ऊपर
  • [मावेन] से GroupDocs.Redaction for Java का नवीनतम संस्करण प्राप्त करें(https://repository.groupdocs.com/webapp/#/artifacts/browse/tree/general/repo/com/groupdocs/groupdocs-redaction)

GroupDocs.Redaction का उपयोग क्यों करें

  • उपयोगकर्ताओं को कस्टम दस्तावेज़ प्रारूप और संपादन के प्रकार जोड़ने की अनुमति दें
  • संवेदनशील जानकारी को हटाने के लिए किसी अतिरिक्त सॉफ़्टवेयर की आवश्यकता नहीं है
  • पेज रेंज रेंडरिंग दस्तावेज़ को PDF के रूप में सेट करने की क्षमता
  • विभिन्न प्रकार के मेटाडेटा को संशोधित करने का आसान तरीका: लेखक का नाम, संस्करण, शीर्षक, विषय, विवरण और बहुत कुछ
  • दस्तावेज़ जानकारी निष्कर्षण - फ़ाइल प्रकार, पृष्ठ संख्या आदि।


What is DOCX File Format?

DOCX is a well-known format for Microsoft Word documents. Introduced from 2007 with the release of Microsoft Office 2007, the structure of this new Document format was changed from plain binary to a combination of XML and binary files. Docx files can be opened with Word 2007 and lateral versions but not with the earlier versions of MS Word which support DOC file extensions.

Read More

लोकप्रिय संपादकीय विभाग विकल्प

Redact CSV फ़ाइलें

(Comma Seperated Values)

Redact DOC फ़ाइलें

(Microsoft Word Binary Format)

Redact DOCM फ़ाइलें

(Microsoft Word 2007 Marco File)

Redact DOT फ़ाइलें

(Microsoft Word Template Files)

Redact DOTM फ़ाइलें

(Microsoft Word 2007+ Template File)

Redact DOTX फ़ाइलें

(Microsoft Word Template File )

Redact PDF फ़ाइलें

(Portable Document Format)

Redact POT फ़ाइलें

(Microsoft PowerPoint Template Files)

Redact POTM फ़ाइलें

(Microsoft PowerPoint Template File)

Redact PPS फ़ाइलें

(PowerPoint Slide Show)

Redact PPSM फ़ाइलें

(Macro-enabled Slide Show)

Redact PPSX फ़ाइलें

(PowerPoint Slide Show)

Redact PPT फ़ाइलें

(Microsoft PowerPoint 97-2003)

Redact PPTM फ़ाइलें

(Macro-enabled Presentation File)

Redact PPTX फ़ाइलें

(Open XML presentation Format)

Redact XLS फ़ाइलें

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM फ़ाइलें

(Macro-enabled Spreadsheet)

Redact XLT फ़ाइलें

(Excel 97 - 2003 Template)

Redact XLTM फ़ाइलें

(Excel Macro-Enabled Template)

Back to top
 हिन्दी