5

英語でTesseractを実行しているときに辞書修正を無効にするにはどうすればよいですか?

現在、tesseract を子プロセスとして実行しています。

4

1 に答える 1

9

これらの変数を false に設定してみてください (構成ファイルに入れます):

load_system_dawg 
load_freq_dawg
load_punc_dawg
load_number_dawg
load_unambig_dawg
load_bigram_dawg
load_fixed_length_dawgs

https://groups.google.com/forum/?fromgroups=#!searchin/tesseract-ocr/Disable$20dictionary$20​​in$20Tesseract/tesseract-ocr/5nvIo1DJxHE/f3gBi2pTKykJ

辞書の信頼/強度を高める方法もお読みください。よくある質問で。それから:

tesseract-ocr < 3.01 の場合、dict/permute.cpp の NON_WERD と GARBAGE_STRING を 3 または 5 に上げてみてください。

tesseract-ocr >= 3.01 の場合、設定ファイルで変数language_model_penalty_non_freq_dict_wordlanguage_model_penalty_non_dict_wordを増やしてみてください。デフォルトでは、それぞれ 0.1 と 0.15 です。

于 2013-01-18T20:55:00.607 に答える