0

私のtess4j OCRアプリケーションでの文字認識の精度は非常に低いです。tess4j で辞書をオフにすると、個々の文字が認識されるようになり、精度が向上すると聞いています。しかし、私はそれを行う方法がわかりません。tess4jで辞書をオフにする方法を知っている人はいますか?

4

1 に答える 1

2

次のように:

TessBaseAPISetVariable(handle, "load_system_dawg", "F");
TessBaseAPISetVariable(handle, "load_freq_dawg", "F");

また

setTessVariable("load_system_dawg", "F");
setTessVariable("load_freq_dawg", "F");

更新

たとえば、次の名前のファイルに以下を入れて、フォルダーbazaarの下に配置します。configs

load_system_dawg     F
load_freq_dawg       F

次に、ファイルの名前を適切なメソッドに渡します。

List<String> configs = Arrays.asList("bazaar");
instance.setConfigs(configs);

参照:
https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc
http://tess4j.sourceforge.net/docs/docs-1.4/

于 2014-10-20T23:39:53.087 に答える