2

写真の例をいくつかご用意しています。

そして、入力された一連の画像があります。すべての入力画像は、次のものを組み合わせた後の例の 1 つです。

1) 回転

2) スケーリング

3) 一部を切り取る

4) ノイズを加える

5) ある色のフィルターを使う

人間が絵の描きやすさを認識できる保証です。

基本例のどれから入力画像を取得するかを認識するためのシンプルだが効果的なアルゴリズムが必要です。

私はC#とJavaで書いています

4

4 に答える 4

1

2 つの画像 f(A,B) 間の特定の変換の確率を計算する一連の関数を作成する必要があります。フーリエなど、多くの変換が答えとして以前に提案されています。おそらく、一度に複数の変換が行われる fgh(A,B) の確率を信頼性を持って計算することはできません。したがって、各変換が個別に適用される確率を計算すると、f(A,B) g(A,B) h(A,B) になり、P がしきい値を超えるものが解になります。

順序が重要な場合、つまり、f(A,B)、g(f,B)、h(g,B) が実行されたことを知る必要がある場合は、隠れマルコフなどの状態ベースの確率フレームワークを採用する必要があります。モデルまたはベイジアン ネットワーク (これは HMM の一般化です) を使用して、状態間を移動する可能性をモデル化します。これらの詳細や最新の AI 書籍については、Matlab の BNT ツールボックス ( http://people.cs.ubc.ca/~murphyk/Software/BNT/bnt.html ) を参照してください。

于 2009-10-19T16:27:33.653 に答える
1

OpenCVには多くのアルゴリズムと機能があり、あなたの問題に適していると思いますが、C#(Cライブラリです)から使用するにはPInvokeで遊ぶ必要があります-実行可能ですが、いくつかの作業が必要です。

于 2009-10-19T07:45:26.730 に答える
1

コンピューター ビジョンの分野では、いくつかの優れた研究が進行中です。解決されている問題の 1 つは、写真が別のビューからクリックされたために導入された縮尺の変更、ノイズの追加、歪みに関係なく、オブジェクトを識別することです。私はこの 2 年前にコンピュータ ビジョン コースの一環として、ほとんど課題をこなしていませんでした。スケール不変特徴変換と呼ばれる変換がありますコーナーポイントのさまざまな特徴を抽出できます。コーナー ポイントは、隣接するすべてのピクセルとは異なるポイントです。ご覧のとおり、写真が 2 つの異なるビューからクリックされた場合、一部のエッジが消えて別のもののように見える場合がありますが、コーナーはほとんど同じままです。この変換は、サイズ 128 の特徴ベクトルをすべてのコーナー ポイントに対して抽出する方法を説明し、これらの特徴ベクトルを使用して 2 つの画像間の類似性を見つける方法を示します。ここでは、あなたが持っているすべての紙幣の1つからこれらの機能を抽出し、テストするはずのテスト画像にこれらのコーナーポイントが存在するかどうかを確認できます

この変換は、回転、スケーリング、クロッピング、ノイズの追加、およびカラー フィルタリングに対して堅牢であるため、これが私が提案できる最高のものだと思います。このデモをチェックして、私が説明した内容をよりよく理解することができます。

于 2009-10-19T06:16:36.427 に答える