रेगुलर एक्सप्रेशन और Java का उपयोग करके PDF फ़ाइलों से टेक्स्ट कैसे हटाएं

GroupDocs.Redaction की Java एपीआई नियमित अभिव्यक्तियों का उपयोग करके वर्ड प्रोसेसिंग दस्तावेजों, वर्कशीट, प्रस्तुतियों, PDF और छवियों से संवेदनशील पाठ को संशोधित करने, छिपाने या हटाने की अनुमति देती है।


नि: शुल्क परीक्षण डाउनलोड करें

टेक्स्ट सेनिटाइजेशन क्या है?

टेक्स्ट रिडेक्शन या सेनिटाइजेशन डिजिटल दस्तावेज़ों से गोपनीय या अवांछित पाठ या जानकारी को हटाने की प्रक्रिया है, जबकि इसमें मौजूद दस्तावेज़ या पैराग्राफ के बाकी हिस्सों को बरकरार रखा जाता है। रिडक्शन उपयोगकर्ताओं के साथ-साथ संगठन को उनकी संवेदनशील जानकारी को छुपाकर या स्थायी रूप से हटाकर सुरक्षित रखने में मदद करता है। GroupDocs.Redaction Java एपीआई का उपयोग करके उपयोगकर्ता अब वर्ड प्रोसेसिंग दस्तावेज़ों, कार्यपत्रकों, प्रस्तुतियों, PDF और रास्टर छवि फ़ाइलों से संवेदनशील पाठ को संपादित, छिपा या हटा सकते हैं। एपीआई दस्तावेजों में निजी जानकारी के संशोधन के लिए विकल्पों और तरीकों की एक विस्तृत श्रृंखला प्रदान करता है। यह नियमित अभिव्यक्तियों, पाठ्य (छूट कोड) या ग्राफिकल (रंगीन आयत) संपादनों के उपयोग और कई अन्य चीजों का उपयोग करके खोज और संपादन का समर्थन करता है। तो क्यों न इसे आज़माएं और एपीआई डाउनलोड करके अपने दस्तावेज़ संशोधन प्रक्रिया को स्वचालित करें और इसकी बुनियादी और उन्नत सुविधाओं का पता लगाएं।

Java में रेगुलर एक्सप्रेशन का उपयोग करके PDF को संशोधित करें

GroupDocs.Redaction आपके दस्तावेज़ों से संवेदनशील या निजी प्रकृति के डेटा को आसानी से संशोधित करने की अनुमति देता है। सबसे लोकप्रिय संशोधन मामला किसी दस्तावेज़ से किसी पाठ को हटाना है।

नियमित अभिव्यक्ति का उपयोग करके किसी दस्तावेज़ के किसी विशेष भाग में पाठ्य संपादन लागू करने के लिए निम्नलिखित कोड का उपयोग किया जा सकता है। यह उपयोगकर्ताओं को “AA BB CCCCCC” से मेल खाते सभी नंबरों को नीले रंग के आयत से बदलने की अनुमति देता है।

PDF से संवेदनशील डेटा हटाएँ

  • Redactor क्लास का एक उदाहरण बनाएं और PDF फ़ाइल अपलोड करें
  • RegexRedaction क्लास का एक उदाहरण बनाएं
  • RegexRedaction क्लास के ऑब्जेक्ट के साथ redactor.apply विधि को कॉल करें
  • परिवर्तनों को सहेजने के लिए redactor.save विधि को कॉल करें


सिस्टम आवश्यकताएं

GroupDocs.Redaction for Java एपीआई सभी प्रमुख प्लेटफार्मों और ऑपरेटिंग सिस्टम पर समर्थित हैं। संपूर्ण सिस्टम आवश्यकता मार्गदर्शिका के लिए, कृपया सिस्टम आवश्यकताएं पर जाएं। नीचे दिए गए कोड को निष्पादित करने से पहले, कृपया सुनिश्चित करें कि आपके सिस्टम पर निम्नलिखित आवश्यक शर्तें इंस्टॉल हैं। :

  • ऑपरेटिंग सिस्टम: माइक्रोसॉफ्ट Windows, Linux, Macओएस
  • विकास पर्यावरण: नेटबीन्स, इंटेलीज आईडीईए, एक्लिप्स आदि
  • Java रनटाइम वातावरण: J2SE 6.0 और ऊपर
  • [मावेन] से GroupDocs.Redaction for Java का नवीनतम संस्करण प्राप्त करें(https://repository.groupdocs.com/webapp/#/artifacts/browse/tree/general/repo/com/groupdocs/groupdocs-redaction)

GroupDocs.Redaction का उपयोग क्यों करें

  • उपयोगकर्ताओं को कस्टम दस्तावेज़ प्रारूप और संपादन के प्रकार जोड़ने की अनुमति दें
  • संवेदनशील जानकारी को हटाने के लिए किसी अतिरिक्त सॉफ़्टवेयर की आवश्यकता नहीं है
  • पेज रेंज रेंडरिंग दस्तावेज़ को PDF के रूप में सेट करने की क्षमता
  • विभिन्न प्रकार के मेटाडेटा को संशोधित करने का आसान तरीका: लेखक का नाम, संस्करण, शीर्षक, विषय, विवरण और बहुत कुछ
  • दस्तावेज़ जानकारी निष्कर्षण - फ़ाइल प्रकार, पृष्ठ संख्या आदि।


What is PDF File Format?

Portable Document Format (PDF) is a type of document created by Adobe back in 1990s. The purpose of this file format was to introduce a standard for representation of documents and other reference material in a format that is independent of application software, hardware as well as Operating System. PDF files can be opened in Adobe Acrobat Reader/Writer as well in most modern browsers like Chrome, Safari, Firefox via extensions/plug-ins. Most of the commercially available software suites also offer conversion of their documents to PDF file format without the requirement of any additional software component.

Read More

लोकप्रिय संपादकीय विभाग विकल्प

Redact CSV फ़ाइलें

(Comma Seperated Values)

Redact DOC फ़ाइलें

(Microsoft Word Binary Format)

Redact DOCM फ़ाइलें

(Microsoft Word 2007 Marco File)

Redact DOCX फ़ाइलें

(Office 2007+ Word Document)

Redact DOT फ़ाइलें

(Microsoft Word Template Files)

Redact DOTM फ़ाइलें

(Microsoft Word 2007+ Template File)

Redact DOTX फ़ाइलें

(Microsoft Word Template File )

Redact POT फ़ाइलें

(Microsoft PowerPoint Template Files)

Redact POTM फ़ाइलें

(Microsoft PowerPoint Template File)

Redact PPS फ़ाइलें

(PowerPoint Slide Show)

Redact PPSM फ़ाइलें

(Macro-enabled Slide Show)

Redact PPSX फ़ाइलें

(PowerPoint Slide Show)

Redact PPT फ़ाइलें

(Microsoft PowerPoint 97-2003)

Redact PPTM फ़ाइलें

(Macro-enabled Presentation File)

Redact PPTX फ़ाइलें

(Open XML presentation Format)

Redact XLS फ़ाइलें

(Microsoft Excel Spreadsheet (Legacy))

Redact XLSM फ़ाइलें

(Macro-enabled Spreadsheet)

Redact XLT फ़ाइलें

(Excel 97 - 2003 Template)

Redact XLTM फ़ाइलें

(Excel Macro-Enabled Template)

Back to top
 हिन्दी