3

私たち人間は、これらの2 つの画像を同じ画像として認識できます。

ここに画像の説明を入力

コンピュータでは、この 2 つの画像が同じサイズであれば認識しやすいため、認識前にスケーリングなどの前処理の段階またはステップを実行する必要がありますが、スケーリングのプロセスを深く見ると、効率的な方法ではありません。

さて、画像をサイズやピクセル位置を扱わないオブジェクトに変換し、認識方法の入力にする方法を見つけるのを手伝ってくれませんか?

よろしくお願いします。

4

2 に答える 2

0

私にはいくつかのアイデアがあります:

  • 画像にいくつかの色のしきい値があるとします。このようにして、同じ色の広い領域を取得します。これらの領域の形状は、数学である曲線でトレースできます。大きい方と小さい方でこれを行うと、曲線が一致するかどうかを確認できます。
  • エリア内の重要なスポットを定義してみてください。これがどのように機能するかはわかりませんが、顔検出アルゴリズムを調べることができます。このようなアルゴリズムには、顔がどのように見えるべきかを表す数式があります。このようなアルゴリズムで十分なオブジェクトを定義すると、画像内に複数のオブジェクトを定義して、オブジェクトが同じ場所で一致するかどうかを確認できます。
  • また、プレデター アルゴリズムが複数のサイズの画像を受け入れることができるかどうかも確認できます。もしそうなら、あなたの問題は解決されました。
于 2012-02-25T13:23:55.417 に答える
0

人間の脳は計算上効果的な方法で画像を認識すると仮定しているように見えますが、これは事実ではありません。このアルゴリズムは非常に複雑であるため、見つけられませんでした。また、視覚データを処理するには、脳の大部分が必要です。

ソフトウェアに関して言えば、いくつかのスケール (またはアフィン) 不変アルゴリズムがあります。そのようなアルゴリズムの 1 つが LeNet 5 ニューラル ネットワークです。

于 2012-02-25T13:16:57.270 に答える