4

スキャン エラーを制限するために、文字のホワイトリストを定義できることがわかりました。

しかし、bool numericMode の情報は見つかりませんでしたocr.Init(@"c:\temp", "fra", false);

数字のみをスキャンしたいとします。ホワイトリストを「0123456789」に設定すると、認識で最良の結果が得られますが、Init メソッドの numericMode パラメータは何をしますか? ホワイトリストが「0123456789」だったとしても、私はいつもそれが間違っているのを見てきました。

また、tessnet にフィードする画像に最適なビットマップ パラメータ (ピクセル形式) は何ですか。

4

2 に答える 2

1

数字のスキャンに関する質問は、Tesseract の FAQに記載されています。バージョン 3 を使用している場合は、次のコマンドを発行するだけで済みます。

tesseract image.tif outputbase nobatch digits
于 2011-09-29T07:54:13.303 に答える
1

経験から、数値モードは結果を数字と補助文字に制限します。「0123456789,.+-/*%<>$(){}」などを見てきました。通貨記号を使用できます。

また、私の経験から言えば、フルカラー画像よりもビット深度を減らしたフォーマットが大きなメリットをもたらすことはありませんでした。ただし、速度については最適化していません。精度のみを最適化しています。フォントが小さい場合 (小文字 >= 8 ピクセルの高さ)、画像を拡大すると精度が大幅に向上します。

于 2012-07-30T23:47:29.563 に答える