performance - Tesseract / Tessnet2 の認識速度と精度を向上させるには?

Question

スキャンエラーを制限するために、文字のホワイトリストを定義できることがわかりました。

しかし、bool numericMode の情報は見つかりませんでしたocr.Init(@"c:\temp", "fra", false);

数字のみをスキャンしたいとします。ホワイトリストを「0123456789」に設定すると、認識で最良の結果が得られますが、Init メソッドの numericMode パラメータは何をしますか? ホワイトリストが「0123456789」だったとしても、私はいつもそれが間違っているのを見てきました。

また、tessnet にフィードする画像に最適なビットマップパラメータ (ピクセル形式) は何ですか。

score 1 · Accepted Answer

数字のスキャンに関する質問は、Tesseract の FAQに記載されています。バージョン 3 を使用している場合は、次のコマンドを発行するだけで済みます。

tesseract image.tif outputbase nobatch digits

score 1 · Accepted Answer

経験から、数値モードは結果を数字と補助文字に制限します。「0123456789,.+-/*%<>$(){}」などを見てきました。通貨記号を使用できます。

また、私の経験から言えば、フルカラー画像よりもビット深度を減らしたフォーマットが大きなメリットをもたらすことはありませんでした。ただし、速度については最適化していません。精度のみを最適化しています。フォントが小さい場合 (小文字 >= 8 ピクセルの高さ)、画像を拡大すると精度が大幅に向上します。

2 に答える 2