1

画像内の記号を見つけるためのピクセルマッチングアルゴリズムで立ち往生しています。解像度の高い画像で見つけようとしているシンボルの画像が2つあります。

ピクセルごとのマッチングアルゴリズムの代わりに、ピクセルマッチングアルゴリズムと同じ結果をもたらす高速アルゴリズムがあります。結果は次のようになります:(一致したピクセルのパーセンテージ)を(合計ピクセル)で除算します。

私の問題は、1ビット画像で特定のシンボルを見つけたいということです。シンボルはターゲット画像に正確に類似して表示され、全ピクセルの95%が画像のターゲットブロックと一致します。しかし、反復を行うには数時間かかります。画像は10kX10kで、シンボルサイズは20 X 20なので、10の10乗で処理するには多すぎます。数分でピクセルマッチングと同じ結果が得られるフィルター/NNの組み合わせやその他のアルゴリズムはありますか?

ここでのポイントは、ピクセルはほぼ同じですが、問題はサイズが非常に大きいことです。ノイズ処理やエッジ、ファジーなどの複雑な機能は必要ありません。ピクセルマッチングをすばやく実行するための単純なアルゴリズムであり、結果は次のようになります。(一致したピクセルのパーセンテージ)を(合計ピクセル)で割る

4

2 に答える 2

2

あなたが明らかに気づいたように、どんな単純なアルゴリズムも一般的に非常に遅くなるという点で、オブジェクト認識はトリッキーです。

幸いなことに、すでに正しくラベル付けされているこれらの画像のかなり大きなコレクションが手元にある場合は、非常に簡単な解決策があります。

ピクセルごとに1つの入力ユニットを使用して3層フィードフォワードネットワークを作成します。これらはすべて、はるかに小さい隠れ層に接続し、次に1つの出力ユニット(画像に存在するシンボルを表す)に接続します。次に、ネットワークがシンボルの識別を学習するまで、データセットに対してバックプロパゲーションアルゴリズムを実行します。

残念ながら、これはあまり拡張性がないため、パフォーマンスを向上させるために畳み込みNNを調べる必要がある場合があります。

さらに、トレーニングデータ(つまり、ラベル付きの例)がない場合、最善の策は、シンボルを特徴に分解してから、それらの画像をスイープすることです。それらを線に分解できる場合、ハフ変換はこれを非常に迅速に行うことができます。

于 2011-06-30T22:49:54.067 に答える
0

たぶん(適応共鳴理論)ART-1ネットワークが役立つかもしれません。

アルゴリズムは、すべてのプロトタイプが同時に並行してチェックされるように作成することもできます。また、本質的にバイナリ数学を多く使用するため、非常に高速になる可能性があります。

于 2013-07-27T17:34:41.547 に答える