私たち人間は、これらの2 つの画像を同じ画像として認識できます。
コンピュータでは、この 2 つの画像が同じサイズであれば認識しやすいため、認識前にスケーリングなどの前処理の段階またはステップを実行する必要がありますが、スケーリングのプロセスを深く見ると、効率的な方法ではありません。
さて、画像をサイズやピクセル位置を扱わないオブジェクトに変換し、認識方法の入力にする方法を見つけるのを手伝ってくれませんか?
よろしくお願いします。
私たち人間は、これらの2 つの画像を同じ画像として認識できます。
コンピュータでは、この 2 つの画像が同じサイズであれば認識しやすいため、認識前にスケーリングなどの前処理の段階またはステップを実行する必要がありますが、スケーリングのプロセスを深く見ると、効率的な方法ではありません。
さて、画像をサイズやピクセル位置を扱わないオブジェクトに変換し、認識方法の入力にする方法を見つけるのを手伝ってくれませんか?
よろしくお願いします。
私にはいくつかのアイデアがあります:
人間の脳は計算上効果的な方法で画像を認識すると仮定しているように見えますが、これは事実ではありません。このアルゴリズムは非常に複雑であるため、見つけられませんでした。また、視覚データを処理するには、脳の大部分が必要です。
ソフトウェアに関して言えば、いくつかのスケール (またはアフィン) 不変アルゴリズムがあります。そのようなアルゴリズムの 1 つが LeNet 5 ニューラル ネットワークです。