python - OCRトランプ

Question

トランプの画像を入力してランクとスーツを返したいという楽しみのプロジェクトをやろうと思いました。左上隅にすべての情報があるので、左上隅を見るだけでよいと思います。堅牢である必要があります。AceofDiamondsの大きな画像がある場合は、20〜200％の範囲で拡大縮小でき、それでも正しい答えが得られるはずです。

最初の質問-これを行うためにすでに書かれたものはありますか？もしそうなら、私はOCRに何か他のものを見つけるので、私は努力を複製しません。

第二に-これを行うための最良の方法は何ですか？神経網？何か手作業でコーディングしましたか？誰かがポインタを与えることができますか？（0xCAAF9452は受け入れ可能な答えではありません）。

score 3 · Accepted Answer

あなたが達成しようとしていることのために何かがすでに書かれているとは思いません（少なくともオープンソースとPythonで）。

2 番目の質問については、何を認識しようとしているかによって異なります。入力がさまざまなソース (たとえば、独特のスタイルを持つさまざまなブランドのトランプなど) から得られる場合は、おそらく機械学習ベースのアルゴリズム (ニューラルネットワークやサポートベクターマシン [SVM] など) を使用する必要があります。未知の入力を認識する方法を学習させます。ただし、入力の形状やスタイルが常に同じである場合は、単純な画像比較アルゴリズムで十分です (たとえば、スライスされた左上隅のピクセルを各ランクのピクセルと比較します)。

機械学習ベースのアルゴリズムを使用することに決めた場合、スーツとランクの形やスタイルはそれほど変わらないため、非常に複雑な機能は必要ないと思います。特徴として左上隅のピクセル。

ここにおもちゃの OCR の例があり、興味深いと思うかもしれません。使用されているライブラリ (LibSVM) には、私が使用した Python バージョンもあり、操作が非常に簡単であることがわかりました。

それが役に立てば幸い。

score 1 · Accepted Answer

限られたサンプルサイズ (4 つのスーツ、13 の異なる値) を考えると、スーツと値の参照画像を新しい入力画像と一致させようとします。最初に、入ってくるスーツ/値のバウンディングボックス (すべての白以外のピクセルを囲む最小のボックス) を見つけ、そのバウンディングボックスのサイズに一致するように参照画像をスケーリングし、ピクセル単位の絶対差から最適な「一致」を見つけます。画像の色 (つまり、赤または黒) を使用すると、これがさらに簡単になります。

score 1 · Accepted Answer

堅牢ではありませんが、カードの 3 ～ 4 か所の色を見て、白か色かを判断できます。常に同じカードを持っていない場合、明らかにこれは機能しません。

score 1 · Accepted Answer

1

個人的には、これで機械学習の道を進みます。

于 2009-08-15T00:48:00.100 に答える

python - OCRトランプ

4 に答える 4

Related

Reference