いくつかのポーカー カードの画像が与えられた場合に、それらのカードの数字を判別できるアプリケーションを開発したいと考えています。これまで画像処理をしたことがないので、どのように始めればよいのだろうか。どんな考えでも大歓迎です!
質問する
387 次
1 に答える
1
画像がどのように見えるかに大きく依存します。たとえば、画像がモバイルカメラから取得され、OCR を実行する前に前処理する必要がある場合。
以前に OCR を実行するためにTesseract ( https://code.google.com/p/tesseract-ocr/ ) を使用しましたが、印刷されたテキストに対しては問題なく動作します。しかし、携帯電話からの画像をトレーニングしないとうまくいきません。自分ですべての作業を行いたくない場合は、サードパーティの有料 API を使用することもできます。
また、私が得たいくつかの貴重なアドバイスは
- 画像内のテキスト部分のみを保持します。(不要なライン/ノイズを除去します)。
- テキストが垂直または角度を付けて配置されている場合は、テキスト領域を水平方向に揃えます。
于 2013-08-26T15:02:48.080 に答える