画像やスキャンした文書には、貴重なテキスト情報が含まれていることがよくあります。**光学式文字認識(OCR)**の力を借りて、これらの画像をプログラム的に検索可能なPDF文書に変換できます。このプロセスにより、JPG、PNG、TIFF、およびBMPなどのさまざまな画像形式を検索可能なPDFに変換できます。以下は、プロセスをガイドするための主要なセクションです:
- OCRを使用した画像から検索可能なPDFコンバータ – C# APIのインストール
- C#を使用してOCRで画像を検索可能なPDFにプログラム的に変換する
- C#でスキューした画像をOCRで検索可能なPDFにプログラム的に変換する
OCRを使用した画像から検索可能なPDFコンバータ – C# APIのインストール
画像やスキャンした文書に対してOCR操作を効率的に実行するには、Aspose.OCR for .NET APIを使用できます。インストールは簡単で、New ReleasesセクションからDLLファイルをダウンロードするか、次のコマンドでNuGetを介してインストールできます:
PM> Install-Package Aspose.OCR
C#を使用してOCRで画像を検索可能なPDFにプログラム的に変換する
以下の手順に従って、JPG、PNG、TIFF、その他の画像形式をC#のOCRを使用して検索可能なPDFに変換します:
- 認識する入力画像のパスを設定します。
- AsposeOcrクラスのインスタンスを初期化します。
- RecognizeImageメソッドを使用して入力画像を認識します。
- 出力を検索可能なPDFファイルとして保存します。
以下は、C#を使用して画像を検索可能なPDFに変換する方法を示すサンプルコードスニペットです:
C#でスキューした画像をOCRで検索可能なPDFにプログラム的に変換する
時には、画像がさまざまな要因によりスキューされることがあります。スキュー角度がわかっている場合は、認識の前に指定できます。ただし、角度が不明な場合、APIが計算してくれます。スキューした画像を検索可能なPDFに変換する手順は以下の通りです:
- 入力画像のパスを指定します。
- AsposeOcrクラスのインスタンスを初期化します。
- RecognitionSettingsクラスのインスタンスを作成します。
- 画像のスキュー角度を計算します。
- 画像を認識し、出力を検索可能なPDFファイルとして保存します。
以下は、C#を使用してスキューした画像をプログラム的に検索可能なPDFに変換する方法です:
以下は、入力画像と出力PDFファイルを示すスクリーンショットです:
無料評価ライセンスを取得
無料一時ライセンスをリクエストすることで、制限なしにAPIを評価できます。
結論
この記事では、C#を使用して画像をプログラム的に検索可能なPDFファイルに変換する方法を学びました。JPG、PNG、BMP、TIFF、またはスキャンした文書を扱っている場合でも、Aspose.OCR APIを使用すればプロセスは簡単です。より多くの機能や詳細なドキュメントについては、ドキュメントセクションを訪れてください。質問がある場合は、無料サポートフォーラムを通じてお気軽にお問い合わせください。