0

tess-two API を使用して、Android でランダムな文字を認識しようとしています。文字列「5XqaLB」を含む印刷された紙のシートを持っています。文字
列の一部を認識してカメラに表示すると、次の例が得られます。

 original -> result
  "5XqaLB" -> "5anLB"  
  "XqaLB" -> "anLB"  
  "qaLB" -> "qaLB"  
  "5Xq" -> "5Xq"

これは、認識された文字で tesseract が単語を推測しようとするために発生すると思います。私はたくさん検索しましたが、解決策を見つけることができません。このテッセラクトの置き換えを避けるためのアイデアはありますか?

次のようなホワイトリスト、ブラックリスト、およびconfをすでに試しました:

baseApi.setVariable("load_system_dawg", "0");
baseApi.setVariable("load_freq_dawg", "0");
baseApi.setVariable("load_punc_dawg", "0");
baseApi.setVariable("load_number_dawg", "0");
baseApi.setVariable("load_unambig_dawg", "0");
baseApi.setVariable("load_bigram_dawg", "0");
baseApi.setVariable("load_fixed_length_dawgs", "0");
baseApi.setVariable("segment_penalty_garbage", "0");
baseApi.setVariable("segment_penalty_dict_nonword", "0");
baseApi.setVariable("segment_penalty_dict_frequent_word", "0");
baseApi.setVariable("segment_penalty_dict_case_ok", "0");
baseApi.setVariable("segment_penalty_dict_case_bad", "0");

tesseractにプレーンな文字のみを認識させる方法を誰かが推測できますか?

4

1 に答える 1