8

私は、携帯電話のカメラを使用してルービックキューブの各面の色付きの正方形の配置を認識するAndroid用の拡張現実アプリケーションを開発しています。

私が確信していないことの1つは、立方体の各面にある色付きの正方形をどれだけ正確に検出して認識するかということです。ルービックキューブを見ると、各正方形が細い黒の境界線を持つ6つの可能な色の1つであることがわかります。これにより、おそらく既存のマーカー検出APIを使用して、比較的単純に正方形を検出する必要があると思いました。

ルービックキューブ

私の質問は本当に、ここの誰かが画像認識とAndroidの経験がありますか?理想的には、既存のAPIを実装できるようにしたいのですが、誰かが私を正しい方向に向けて始めることができれば、ゼロから行うのは興味深いプロジェクトです。

よろしくお願いします。

4

5 に答える 5

5

カメラを立方体に向けて、構成を理解してもらいたいですか?

写真に写っている物体を認識することは、AIの未解決の問題です。したがって、問題を引き付けるには、問題をかなり制限する必要があります。次のようなものから始めることをお勧めします。

  1. 立方体は、カメラの真後ろに100Wの光源を使用して、正確に12インチの距離から撮影されます。立方体は対角線上に設定されるため、中央にコーナーがあり、正確に3つの面が表示されます。カメラは、中央の立方体の角に直接焦点を合わせるように配置されます。

  2. 写真を撮ります。次に、立方体を垂直方向と水平方向に180度回転させて、他の3つの面が表示されるようにします。2枚目の写真が撮られます。各面がどこにあると予想されるかを正確に知っているので、各領域から数ピクセルを取得し、それがその正方形の色であると想定します。キューブは通常、ここの図に示すように均一ではなく、スクランブルされていることに注意してください。したがって、それぞれの色を取得するには、常に9 * 6=54個の小さな正方形を見る必要があります。

  3. これらの2つの図の情報は、キューブ構成を定義します。同じ構成でキューブのイメージを生成し、ユーザーがそれを確認または修正できるようにします。

各顔に1枚ずつ、合計6枚の写真を撮り、明確に定義された順序で顔の周りを移動する方が簡単な場合があります。各面の中央の正方形は移動せず、その面の正しい色を定義することに注意してください。

構成が完了したら、OpenGL操作を使用してキューブスライスを回転できます。これは、キューブを定義および回転するための数百行のコードに加えて、画像認識のために行うすべてのコードを含むプログラムになります。

于 2010-03-09T21:57:04.150 に答える
1

ピーターが言ったことに加えて、ユーザーが写真を撮るときに、立方体の写真にガイドラインを重ねるのがおそらく最善です。次に、ユーザーは、立方体を1辺(正方形のガイドライン)または3辺(遠近法で3つの正方形)のどちらであっても、ガイドライン内に並べます。また、各行の色付きのボックスの数をユーザーに指定してもらうこともできます。コードで、各色付きボックスの中央にある色をサンプリングし、他の色付きボックスと比較して(ある程度の許容範囲内で)色を識別します。認識された結果をユーザーに提供することに加えて、ユーザーが認識された色を変更できるようにすると便利です。派手な画像認識が必要なようには思えません。

于 2010-06-15T20:37:40.307 に答える
0

いいアイデアです。コンピュータービジョンとマーカー検出器も使用する予定ですが、別のプロジェクトで使用する予定です。私はまだウェブ上に利用可能な情報があるかどうかを探しています。例:openCVまたはARtoolkitをAndroidSDKにリンクする。コンピュータビジョンAPIをリンクする方法について、追加情報があれば、私に知らせてください。

また会いましょう!

于 2010-03-27T19:47:42.047 に答える
0

NYARToolkitはマーカー検出を使用し、JAVA(およびWindowsデバイス用のマネージドC#)で作成されます。Androidプラットフォームでどれだけうまく機能するかはわかりませんが、Windowsモバイルデバイスで使用されているのを見て、非常によくできています。

頑張って、そして幸せなプログラミング!

于 2010-08-17T15:47:59.250 に答える
0

AndoidOpenCVライブラリを確認することをお勧めします。おそらく、ブロブ検出アルゴリズムを調べたいと思うでしょう。クワッドを検出するために、ハフラインまたはカウントを検討することもできます。

于 2013-03-22T09:18:42.577 に答える