11

トランプの画像を入力してランクとスーツを返したいという楽しみのプロジェクトをやろうと思いました。左上隅にすべての情報があるので、左上隅を見るだけでよいと思います。堅牢である必要があります。AceofDiamondsの大きな画像がある場合は、20〜200%の範囲で拡大縮小でき、それでも正しい答えが得られるはずです。

最初の質問-これを行うためにすでに書かれたものはありますか?もしそうなら、私はOCRに何か他のものを見つけるので、私は努力を複製しません。

第二に-これを行うための最良の方法は何ですか?神経網?何か手作業でコーディングしましたか?誰かがポインタを与えることができますか?(0xCAAF9452は受け入れ可能な答えではありません)。

4

4 に答える 4

3

あなたが達成しようとしていることのために何かがすでに書かれているとは思いません(少なくともオープンソースとPythonで)。

2 番目の質問については、何を認識しようとしているかによって異なります。入力がさまざまなソース (たとえば、独特のスタイルを持つさまざまなブランドのトランプなど) から得られる場合は、おそらく機械学習ベースのアルゴリズム (ニューラル ネットワークやサポート ベクター マシン [SVM] など) を使用する必要があります。未知の入力を認識する方法を学習させます。ただし、入力の形状やスタイルが常に同じである場合は、単純な画像比較アルゴリズムで十分です (たとえば、スライスされた左上隅のピクセルを各ランクのピクセルと比較します)。

機械学習ベースのアルゴリズムを使用することに決めた場合、スーツとランクの形やスタイルはそれほど変わらないため、非常に複雑な機能は必要ないと思います。特徴として左上隅のピクセル。

ここにおもちゃの OCR の例があり、興味深いと思うかもしれません。使用されているライブラリ (LibSVM) には、私が使用した Python バージョンもあり、操作が非常に簡単であることがわかりました。

それが役に立てば幸い。

于 2009-08-14T21:28:24.120 に答える
1

限られたサンプル サイズ (4 つのスーツ、13 の異なる値) を考えると、スーツと値の参照画像を新しい入力画像と一致させようとします。最初に、入ってくるスーツ/値のバウンディング ボックス (すべての白以外のピクセルを囲む最小のボックス) を見つけ、そのバウンディング ボックスのサイズに一致するように参照画像をスケーリングし、ピクセル単位の絶対差から最適な「一致」を見つけます。画像の色 (つまり、赤または黒) を使用すると、これがさらに簡単になります。

于 2009-08-17T14:41:17.643 に答える
1

堅牢ではありませんが、カードの 3 ~ 4 か所の色を見て、白か色かを判断できます。常に同じカードを持っていない場合、明らかにこれは機能しません。

于 2009-08-15T00:38:49.457 に答える
1

個人的には、これで機械学習の道を進みます。

于 2009-08-15T00:48:00.100 に答える