画像からPDF OCR

画像やスキャンした文書には、貴重なテキスト情報が含まれていることがよくあります。**光学式文字認識(OCR)**の力を借りて、これらの画像をプログラム的に検索可能なPDF文書に変換できます。このプロセスにより、JPGPNGTIFF、およびBMPなどのさまざまな画像形式を検索可能なPDFに変換できます。以下は、プロセスをガイドするための主要なセクションです:

OCRを使用した画像から検索可能なPDFコンバータ – C# APIのインストール

画像やスキャンした文書に対してOCR操作を効率的に実行するには、Aspose.OCR for .NET APIを使用できます。インストールは簡単で、New ReleasesセクションからDLLファイルをダウンロードするか、次のコマンドでNuGetを介してインストールできます:

PM> Install-Package Aspose.OCR

C#を使用してOCRで画像を検索可能なPDFにプログラム的に変換する

以下の手順に従って、JPG、PNG、TIFF、その他の画像形式をC#のOCRを使用して検索可能なPDFに変換します:

  1. 認識する入力画像のパスを設定します。
  2. AsposeOcrクラスのインスタンスを初期化します。
  3. RecognizeImageメソッドを使用して入力画像を認識します。
  4. 出力を検索可能なPDFファイルとして保存します。

以下は、C#を使用して画像を検索可能なPDFに変換する方法を示すサンプルコードスニペットです:

C#でスキューした画像をOCRで検索可能なPDFにプログラム的に変換する

時には、画像がさまざまな要因によりスキューされることがあります。スキュー角度がわかっている場合は、認識の前に指定できます。ただし、角度が不明な場合、APIが計算してくれます。スキューした画像を検索可能なPDFに変換する手順は以下の通りです:

  1. 入力画像のパスを指定します。
  2. AsposeOcrクラスのインスタンスを初期化します。
  3. RecognitionSettingsクラスのインスタンスを作成します。
  4. 画像のスキュー角度を計算します。
  5. 画像を認識し、出力を検索可能なPDFファイルとして保存します。

以下は、C#を使用してスキューした画像をプログラム的に検索可能なPDFに変換する方法です:

以下は、入力画像と出力PDFファイルを示すスクリーンショットです:

画像からPDF OCR

無料評価ライセンスを取得

無料一時ライセンスをリクエストすることで、制限なしにAPIを評価できます。

結論

この記事では、C#を使用して画像をプログラム的に検索可能なPDFファイルに変換する方法を学びました。JPG、PNG、BMP、TIFF、またはスキャンした文書を扱っている場合でも、Aspose.OCR APIを使用すればプロセスは簡単です。より多くの機能や詳細なドキュメントについては、ドキュメントセクションを訪れてください。質問がある場合は、無料サポートフォーラムを通じてお気軽にお問い合わせください。

参照