c# - 画像の最適な基準を探す【画像認識】

Question

写真の例をいくつかご用意しています。

そして、入力された一連の画像があります。すべての入力画像は、次のものを組み合わせた後の例の 1 つです。

1) 回転

2) スケーリング

3) 一部を切り取る

4) ノイズを加える

5) ある色のフィルターを使う

人間が絵の描きやすさを認識できる保証です。

基本例のどれから入力画像を取得するかを認識するためのシンプルだが効果的なアルゴリズムが必要です。

私はC#とJavaで書いています

score 1 · Accepted Answer

2 つの画像 f(A,B) 間の特定の変換の確率を計算する一連の関数を作成する必要があります。フーリエなど、多くの変換が答えとして以前に提案されています。おそらく、一度に複数の変換が行われる fgh(A,B) の確率を信頼性を持って計算することはできません。したがって、各変換が個別に適用される確率を計算すると、f(A,B) g(A,B) h(A,B) になり、P がしきい値を超えるものが解になります。

順序が重要な場合、つまり、f(A,B)、g(f,B)、h(g,B) が実行されたことを知る必要がある場合は、隠れマルコフなどの状態ベースの確率フレームワークを採用する必要があります。モデルまたはベイジアンネットワーク (これは HMM の一般化です) を使用して、状態間を移動する可能性をモデル化します。これらの詳細や最新の AI 書籍については、Matlab の BNT ツールボックス ( http://people.cs.ubc.ca/~murphyk/Software/BNT/bnt.html ) を参照してください。

score 1 · Accepted Answer

OpenCVには多くのアルゴリズムと機能があり、あなたの問題に適していると思いますが、C＃（Cライブラリです）から使用するにはPInvokeで遊ぶ必要があります-実行可能ですが、いくつかの作業が必要です。

score 1 · Accepted Answer

コンピュータービジョンの分野では、いくつかの優れた研究が進行中です。解決されている問題の 1 つは、写真が別のビューからクリックされたために導入された縮尺の変更、ノイズの追加、歪みに関係なく、オブジェクトを識別することです。私はこの 2 年前にコンピュータビジョンコースの一環として、ほとんど課題をこなしていませんでした。スケール不変特徴変換と呼ばれる変換がありますコーナーポイントのさまざまな特徴を抽出できます。コーナーポイントは、隣接するすべてのピクセルとは異なるポイントです。ご覧のとおり、写真が 2 つの異なるビューからクリックされた場合、一部のエッジが消えて別のもののように見える場合がありますが、コーナーはほとんど同じままです。この変換は、サイズ 128 の特徴ベクトルをすべてのコーナーポイントに対して抽出する方法を説明し、これらの特徴ベクトルを使用して 2 つの画像間の類似性を見つける方法を示します。ここでは、あなたが持っているすべての紙幣の1つからこれらの機能を抽出し、テストするはずのテスト画像にこれらのコーナーポイントが存在するかどうかを確認できます

この変換は、回転、スケーリング、クロッピング、ノイズの追加、およびカラーフィルタリングに対して堅牢であるため、これが私が提案できる最高のものだと思います。このデモをチェックして、私が説明した内容をよりよく理解することができます。

c# - 画像の最適な基準を探す【画像認識】

4 に答える 4

Related

Reference