1

OCRを含める必要のあるプロジェクトを完了しようとしています。仕事のために私はTesseractOCRを選びましたが、結果は最適ではありません。文字セットをに制限しようとしまし1234567890-たが、結果は良くありません。この種の文字列をよりよく認識するようにTesseractをトレーニングするために使用できる最適な画像サイズ、または何らかの方法はありますか?

画像はこれです:電話

そして、結果のtesseractは05175150152を返しますが、これは正しくありません。画像はまったく変更されていないため、より良いはずです。私は次のコマンドでexecを使用してPHPを介してtesseractを使用します。

"C:\Program Files\Tesseract-OCR\tesseract.exe" C:\wamp\www\a
dwords\phones\center_ctl09_ctl04.png sssd -l eng -psm 7 nobatch letters

私が間違っていることについてのアイデアはありますか?

4

1 に答える 1

3

96 DPI の画像解像度は、OCR エンジンにとって厳しいものです。300 DPI に再スケーリングすると、より良い結果が得られます。

さらに、JPEG は非可逆画像形式です。可能であれば、TIFF や PNG などの別のものを使用してください。

于 2012-05-12T20:47:46.767 に答える