私のtess4j OCRアプリケーションでの文字認識の精度は非常に低いです。tess4j で辞書をオフにすると、個々の文字が認識されるようになり、精度が向上すると聞いています。しかし、私はそれを行う方法がわかりません。tess4jで辞書をオフにする方法を知っている人はいますか?
質問する
1880 次
1 に答える
2
次のように:
TessBaseAPISetVariable(handle, "load_system_dawg", "F");
TessBaseAPISetVariable(handle, "load_freq_dawg", "F");
また
setTessVariable("load_system_dawg", "F");
setTessVariable("load_freq_dawg", "F");
更新:
たとえば、次の名前のファイルに以下を入れて、フォルダーbazaar
の下に配置します。configs
load_system_dawg F
load_freq_dawg F
次に、ファイルの名前を適切なメソッドに渡します。
List<String> configs = Arrays.asList("bazaar");
instance.setConfigs(configs);
参照:
https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc
http://tess4j.sourceforge.net/docs/docs-1.4/
于 2014-10-20T23:39:53.087 に答える