PDF اسکن شده به Word OCR C#

فایل‌های PDF اسکن شده معمولاً حاوی تصاویری هستند که متن قابل انتخاب یا ویرایش نیست. در سناریوهای مختلف، ممکن است نیاز داشته باشید که یک PDF اسکن شده را به یک سند Word تبدیل کنید. این مقاله شما را در فرآیند تبدیل فایل‌های PDF اسکن شده به اسناد Word در فرمت DOCX یا DOC به صورت برنامه‌نویسی با استفاده از C# راهنمایی می‌کند.

فهرست مطالب

نصب تبدیل‌کننده PDF اسکن شده به Word DOCX – نصب API C#

برای کار با فایل‌های PDF اسکن شده، می‌توانید از شناسایی نوری کاراکتر (OCR) با استفاده از API Aspose.OCR for .NET استفاده کنید. پس از شناسایی متن، می‌توانید یک سند Word با استفاده از API Aspose.Words for .NET ایجاد کنید. می‌توانید این API‌ها را با دانلود فایل‌های DLL از نسخه‌های جدید یا با استفاده از دستورات نصب NuGet زیر نصب کنید:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

تبدیل PDF اسکن شده به سند Word به صورت برنامه‌نویسی با استفاده از C#

برای تبدیل فایل‌های PDF اسکن شده به اسناد Word، باید متن را به صورت نوری شناسایی کنید. عملیات OCR PDF اسکن شده را به متن تبدیل می‌کند که سپس می‌توان آن را به یک سند Word در فرمت DOC یا DOCX قالب‌بندی کرد. مراحل زیر را برای تبدیل PDF اسکن شده به یک سند Word دنبال کنید:

  1. یک نمونه از کلاس AsposeOcr را راه‌اندازی کنید.
  2. از کلاس DocumentRecognitionSettings برای شناسایی تصاویر از PDF استفاده کنید.
  3. یک شی StringBuilder برای ذخیره متن شناسایی شده ایجاد کنید.
  4. یک سند Word با استفاده از کلاس Document راه‌اندازی کنید.
  5. فرمت‌های لازم فونت و پاراگراف را مشخص کنید.
  6. سند Word خروجی را در فرمت DOCX یا DOC ذخیره کنید.

در اینجا یک کد نمونه وجود دارد که نحوه تبدیل یک فایل PDF اسکن شده به یک سند Word به صورت برنامه‌نویسی با استفاده از C# را نشان می‌دهد:

دریافت مجوز ارزیابی رایگان

شما می‌توانید API‌ها را به طور کامل آزمایش کنید و با درخواست یک مجوز موقت رایگان این کار را انجام دهید.

نتیجه‌گیری

در این مقاله، یاد گرفتید که چگونه یک فایل PDF اسکن شده را به یک سند Word در فرمت DOCX یا DOC به صورت برنامه‌نویسی با استفاده از C# تبدیل کنید. علاوه بر این، می‌توانید با مراجعه به مستندات ویژگی‌های دیگر مرتبط با OCR را بررسی کنید. اگر سوالی دارید، می‌توانید به ما در فروم مراجعه کنید.

همچنین ببینید

نکته: اگر به هر دلیلی نیاز به تبدیل یک ارائه PowerPoint به سند Word دارید، از تبدیل‌کننده Aspose تبدیل ارائه به سند Word استفاده کنید.

با استفاده از افزونه Aspose، می‌توانید به طور مؤثر فایل‌های اسکن شده را مدیریت کرده و برنامه‌های .NET خود را تنها با ۹۹ دلار بهبود بخشید.