12

大量の写真をチェックして、キーワードが含まれているかどうかを確認する必要があります。信頼できる優れた OCR ライブラリを推奨できる人はいますか? 精度のために速度を喜んで犠牲にします。

4

2 に答える 2

25

精度に関係する純粋な Java OCR ライブラリはありません。予算に応じて、純粋な Java ではなく、Java から呼び出すことができるものを選択できます。

  • 時間は十分にあるが予算がない場合は、Tesseract を選択してください。オープンソースの中で間違いなく最高です
  • 予算が少なく、この認識を 1 回実行するだけでよい場合は、Cloud OCR APIサービスが最適です。これは、主要な商用グレードの OCR エンジンに基づいており、プロジェクトごとに非常に手頃な価格を提供します。免責事項: 私は ABBYY で働いています
  • この認識を継続的なプロセスとして永久に実行する必要がある場合は、専用の変換ソフトウェアを購入する方が経済的に効率的であると考えるかもしれません。これに、API があり、Java からも呼び出すことができます。しかし、ライセンスにいくらかの予算を投資する準備ができている場合は、実際には多くの選択肢があります。
于 2013-07-24T07:35:01.627 に答える
2

ラテン記号や数字記号ではない認識を計画している場合は、Java以外のライブラリを見つけるより良い方法がありますが、いくつかの(外部)ツールから選択し、テキストを取得するために他の方法(1)を使用してください。Linux では、コマンド ライン インターフェイス経由で cuneiform(2) を使用しました。

  1. たとえば、コマンド ライン インターフェイスとパイプ。

  2. cuneiform は Linux に移植されましたが、Windows の作業コマンド ライン インターフェイスについてはわかりません。

于 2013-07-24T07:49:43.940 に答える