GoogleのTesseractAPIを使用してテキストを認識するための基本的なアプリを作成し、それをカメラアプリと統合しました。正常に動作しますが、唯一の問題は精度です。テキストがランダムな文字セットとして認識されることがあり、精度は約50%だと思います。
さらに、画像内の4つ以上の単語をスキャンしようとすると、アプリがクラッシュします。
String ocrText = baseApi.getUTF8Text();
baseApi.end();
ここbaseApi
で、はTesseractAPIクラスのオブジェクトです。
認識されたテキストを保存するために別のデータ構造を使用する必要がありますか、それとも4つ以上の単語が認識されない他の理由がありますか?