cmd - tesseract で Asterix(*) を使用する方法はありますか?

Question

すべてのボックスファイルを使用して文字を抽出しようとしていますが、この行を試してみると

unicharset_extractor *.box

すべてのボックスファイルをロードする代わりに、*.box が見つからないというエラーが表示されます。

score 0 · Accepted Answer

私は最終的にそのための独自のツールを作りました。[リンク] http://code.google.com/p/serak-tesseract-trainer/ ここに画像の説明を入力

score 0 · Accepted Answer

その特定のプログラムは、そのような構文をサポートしていません。次のように、すべてのボックスファイルとフィードの名前を連鎖させる必要があります。

unicharset_extractor lang.fontname.exp0.box lang.fontname.exp1.box ...

プロセスを自動化するスクリプト (例: train.ps1 ) を作成できます。

2 に答える 2