Java アプリケーション サーバーから tesseract OCR (光学式文字認識を行う C++ のオープン ソース ライブラリ) を呼び出す必要があります。現在、Runtime.exec() を使用して実行可能ファイルを実行するのは簡単です。基本的なロジックは
- 現在メモリに保持されているイメージをファイル (.tif) に保存します。
- イメージ ファイル名を tesseract コマンド ライン プログラムに渡します。
- FileReader を使用して Java から出力テキスト ファイルを読み込みます。
Tesseract 用の JNI ラッパーを作成することで、パフォーマンスがどの程度向上する可能性がありますか? 残念ながら、Linux で動作するオープン ソースの JNI ラッパーはありません。私は自分でそれをしなければならず、その利益が開発コストに見合うかどうか疑問に思っています.