さて、私はこのOCRのコンパイルされた.NETバージョンを使用しています。これは@ http://www.pixel-technology.com/freeware/tessnet2/で見つけることができます
私はそれを機能させていますが、これの目的はナンバープレートを翻訳することです.悲しいことに、エンジンは実際にはいくつかの文字を正確に翻訳しません.たとえば、これは文字の問題を特定するためにスキャンした画像です.
結果:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
したがって、次の文字は正しく変換されていません。
1、O、Q、W
これはそれほど悪くはないようですが、私のナンバープレートでは、結果はそれほど良くありません:
= H4 ODM
= LDH IFW
偽のテスト
= NR4 y2k
お分かりかもしれませんが、ノイズ リダクション、コントラストの増加、完全な黒ではないピクセルの削除を試しましたが、実際の改善は見られませんでした。
エンジンの新しいフォントを「学習」できるようですが、ライブラリを .NET 用に再コンパイルする必要があると思います。これは、私が持っていない Linux OS で実行されているようです。
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
だから私は次に何をしようか迷っています。誰かがそれを試してみたいと思っている場合に備えて、純粋にテスト目的で簡単なコンソールアプリケーションを書きました。アイデア/グラフィック操作/ライブラリの考えがある場合は、聞いていただければ幸いです。