Tesseract 3.02 を使用して、検証目的 (自動化テスト) でアプリケーションからテキストを読み取ろうとしています。フォント サイズが小さい場合 (8 ~ 10)、常に間違った結果が返されます。画像をtesseractに渡す前に、以下の画像処理に従いました。1. 画像をグレースケールに変換。(画像形式 JPG) 2. 再スケーリングされた画像 3. 300 DPI に変換された画像
画像を前処理した後、それをtesseractに渡しました。私が持っているアプリケーション画像のほとんどは、フォントサイズが小さいです。また、トレーニングされたデータでフォントの種類が利用できることを確認しましたが、それでも精度のパーセンテージは低くなります。
何か不足している場合は、誰でも私を案内できますか。