PDF yang Dipindai ke Word OCR csharp

File PDF yang dipindai seringkali berisi gambar di mana teks tidak dapat dipilih atau diedit. Dalam berbagai skenario, Anda mungkin perlu mengonversi PDF yang dipindai ke dokumen Word. Artikel ini akan memandu Anda melalui proses mengonversi file PDF yang dipindai menjadi dokumen Word dalam format DOCX atau DOC secara programatis menggunakan C#.

Daftar Isi

Pengonversi PDF yang Dipindai ke Word DOCX – Instalasi API C#

Untuk bekerja dengan file PDF yang dipindai, Anda dapat melakukan Pengenalan Karakter Optik (OCR) menggunakan API Aspose.OCR untuk .NET. Setelah mengenali teks, Anda dapat membuat dokumen Word menggunakan API Aspose.Words untuk .NET. Anda dapat menginstal API ini dengan mengunduh file DLL dari Rilis Baru atau dengan menggunakan perintah instalasi NuGet berikut:

PM> Install-Package Aspose.OCR
PM> Install-Package Aspose.Words

Mengonversi PDF yang Dipindai ke Dokumen Word Secara Programatis Menggunakan C#

Untuk mengonversi file PDF yang dipindai ke dokumen Word, Anda perlu mengenali teks secara optik. Operasi OCR akan mengonversi PDF yang dipindai menjadi teks, yang kemudian dapat diformat menjadi dokumen Word dalam format DOC atau DOCX. Ikuti langkah-langkah berikut untuk mengonversi PDF yang dipindai menjadi dokumen Word:

  1. Inisialisasi instance kelas AsposeOcr.
  2. Gunakan kelas DocumentRecognitionSettings untuk mengenali gambar dari PDF.
  3. Buat objek StringBuilder untuk menyimpan teks yang dikenali.
  4. Inisialisasi dokumen Word menggunakan kelas Document.
  5. Tentukan format font dan paragraf yang diperlukan.
  6. Simpan dokumen Word keluaran dalam format DOCX atau DOC.

Berikut adalah cuplikan kode yang menunjukkan cara mengonversi file PDF yang dipindai menjadi dokumen Word secara programatis menggunakan C#:

Dapatkan Lisensi Evaluasi Gratis

Anda dapat menguji API hingga kapasitas penuh dengan meminta lisensi sementara gratis.

Kesimpulan

Dalam artikel ini, Anda telah belajar bagaimana mengonversi file PDF yang dipindai menjadi dokumen Word dalam format DOCX atau DOC secara programatis menggunakan C#. Selain itu, Anda dapat menjelajahi berbagai fitur terkait OCR lainnya dengan mengunjungi dokumentasi. Jika Anda memiliki pertanyaan, jangan ragu untuk menghubungi kami di forum.

Lihat Juga

Tip: Jika Anda perlu mengonversi presentasi PowerPoint menjadi dokumen Word, pertimbangkan untuk menggunakan konverter Aspose Presentasi ke Dokumen Word.

Dengan memanfaatkan Plugin Aspose, Anda dapat mengelola file yang dipindai secara efektif dan meningkatkan aplikasi .NET Anda hanya dengan $99.