GroupDocs.Parser for .NET

استخراج متن از RTF با استفاده از C#

به‌سرعت متن قابل خواندن و ساختاریافته را از فایل‌های PDF، Word، Excel و سایر انواع فایل با استفاده از GroupDocs.Parser در راه‌حل‌های .NET خود استخراج کنید.

مراحل استخراج متن از Rtf در C#

شما می‌توانید متن تمیز و ساختاریافته را از اسناد RTF در اپلیکیشن‌های .NET با دنبال کردن این مراحل با GroupDocs.Parser استخراج کنید:

  1. اسناد RTF را با استفاده از یک نمونه Parser باز کنید.
  2. متن را از محتوای فایل استخراج کنید.
  3. نتیجه را بررسی کنید تا اطمینان حاصل شود که استخراج متن موفقیت‌آمیز بود.
  4. از متن استخراج شده در منطق کسب‌وکار، ایندکس‌گذاری یا پایپ‌لاین‌های داده خود استفاده کنید.
// مدارک خود را به Parser بارگذاری کنید
using (Parser parser = new Parser("input.rtf")) {

    // تمام محتوای متنی را از فایل استخراج کنید
    using (TextReader reader = parser.GetText()) 
    {
        // اگر متن موجود نیست، نتیجه null خواهد بود
        // از متن استخراج شده در اپلیکیشن خود استفاده کنید
        Console.WriteLine(reader == null ? 
            "استخراج متن برای این فرمت پشتیبانی نمی‌شود" : reader.ReadToEnd());
    }
}
dotnet add package GroupDocs.Parser
برای کپی کلیک کنید
کپی شد
نمونه‌های بیشتر مستندات

ویژگی‌های جامع استخراج محتوا

علاوه بر متن ساده، GroupDocs.Parser می‌تواند تصاویر، عناصر ساختاریافته و متا دیتا را استخراج کند تا از تجزیه و تحلیل محتوا، تبدیل و اتوماسیون پشتیبانی کند.

شناسایی متن و تجزیه اسناد ساختاریافته

استخراج متن از انواع فایل‌های مختلف

متن ساده یا ساختاریافته را از فرمت‌هایی مانند PDF، DOCX، XLSX، PPTX، HTML و دیگر فرمت‌ها دریافت کنید.

پردازش متن از اسناد و تصاویر

متن را از تصاویر اسکن‌شده، ارائه‌ها، صفحه‌گسترده‌ها و اسناد دیجیتال در حالی که ساختار حفظ می‌شود، استخراج کنید.

پیکربندی پیشرفته استخراج متن

نحوه شناسایی متن را سفارشی کنید—محدوده‌های صفحه، مناطق چیدمان را تعریف کنید و خروجی را برای حداکثر دقت تنظیم نمایید.

چگونه مناطق متنی را از یک فایل PPTX استخراج کنیم

این نمونه کد نشان می‌دهد که چگونه محتویات متنی را همراه با مختصات ناحیه از یک فایل پاورپوینت با استفاده از GroupDocs.Parser بازیابی کنید.

C#

//  ارائه پاورپوینت را با Parser بارگذاری کنید
using (Parser parser = new Parser("input.pptx"))
{
    // تمام مستطیل‌های مناطق متنی را از سند استخراج کنید
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();

    // اگر استخراج ناحیه متنی در دسترس نیست، خارج شوید
    if (areas == null)
    {
        return;
    }

    // در هر صفحه از نواحی متنی عبور کنید
    foreach (PageTextArea a in areas)
    {
        // به ایندکس صفحه، مستطیل ناحیه و مقدار متن دسترسی پیدا کنید
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

درباره API GroupDocs.Parser for .NET

GroupDocs.Parser یک API با عملکرد بالا برای تجزیه اسناد برای توسعه‌دهندگان .NET است. این API استخراج متن، تصاویر، جداول و محتوای ساختاریافته از چندین فرمت فایل از جمله PDF، DOCX، XLSX، PPTX و بیشتر را بدون وابستگی به کتابخانه‌های شخص ثالث آسان می‌کند.
بیشتر بدانید
About illustration

برای شروع آماده اید؟

GroupDocs.Parser را به صورت رایگان دانلود کنید یا یک مجوز آزمایشی برای دسترسی کامل دریافت کنید!

منابع مفید

برای ارتقاء تجربه خود ، مستندات ، نمونه های کد و پشتیبانی جامعه را کاوش کنید.

فرمت‌های پشتیبانی‌شده برای استخراج متن

GroupDocs.Parser استخراج متن را از مجموعه وسیعی از انواع مدارک و تصاویر ممکن می‌سازد. فرمت‌های معمول پشتیبانی شده در زیر را بررسی کنید.

نکات مجوز موقت

1
با ایمیل کاری خود ثبت نام کنید. خدمات پست الکترونیکی رایگان مجاز نیستند.
2
در مرحله دوم از دکمه دریافت مجوز موقت استفاده کنید.
 فارسی