英語でTesseractを実行しているときに辞書修正を無効にするにはどうすればよいですか?
現在、tesseract を子プロセスとして実行しています。
英語でTesseractを実行しているときに辞書修正を無効にするにはどうすればよいですか?
現在、tesseract を子プロセスとして実行しています。
これらの変数を false に設定してみてください (構成ファイルに入れます):
load_system_dawg
load_freq_dawg
load_punc_dawg
load_number_dawg
load_unambig_dawg
load_bigram_dawg
load_fixed_length_dawgs
辞書の信頼/強度を高める方法もお読みください。よくある質問で。それから:
tesseract-ocr < 3.01 の場合、dict/permute.cpp の NON_WERD と GARBAGE_STRING を 3 または 5 に上げてみてください。
tesseract-ocr >= 3.01 の場合、設定ファイルで変数language_model_penalty_non_freq_dict_wordとlanguage_model_penalty_non_dict_wordを増やしてみてください。デフォルトでは、それぞれ 0.1 と 0.15 です。