Android tess-two https://github.com/rmtheis/tess-twoに人気の OCR tessercat フォークを使用しています。私はすべてのスタッフを統合し、それは動作します...
しかし、数字だけを検出する必要があります。今のところ私のコードは次のとおりです。
TessBaseAPI baseApi = new TessBaseAPI();
baseApi.init(pathToLngFile, langName);
baseApi.setImage(bitmap);
String recognizedText = baseApi.getUTF8Text();
baseApi.end();
doSomething(recognizedText);
ここからhttps://code.google.com/p/tesseract-ocr/wiki/FAQ#How_do_I_recognize_only_digits ?
私はバージョン V3 を使用していますが、コマンド ライン ソリューションの代わりにコード ソリューションはありません - Android プロジェクトには関係ありません (私は思う...)。そこで、バージョン < V3 のソリューションを実装して、次の行を追加しようとしました。
baseApi.SetVariable("tessedit_char_whitelist", "0123456789");
私の質問は、init() をどうするか? 言語は必要ありませんが、init() メソッドを init する必要があります...
編集:より具体的には
私の最終的な目標は、添付の写真 (ヘッダーと空白で区切られた 3 つの列) のように見える単純なドキュメント (純粋な Excel シートではない) です。
私の要件は、数字で意味をなすことです。どの数字がどの行と列に属しているかを分離して判断できるようにすることです。
ありがとう、