1

脳がパターンの階層を使用して、本に書かれた文字や単語、物理的なオブジェクト、またはその性質の他のものなどの概念や感覚情報を認識してモデル化する方法についての本を読んでいました。しかし、そのようなシステムの単純なバージョンをどのように実装するかについて、私は少し混乱しています。これについていくつか質問があります。

  • まず、このコンテキストにおけるパターンのすべての特徴は正確には何ですか?
  • そして、そのようなパターンのヒエラルキーにおける最も基本的な要素は何ですか?
  • ニューラル ネットワークではなく、アルゴリズムによってそれらを認識する方法はありますか?
  • ピクセルのラインからパターンを定式化するプログラムを作成する場合、それはいくぶん簡単かもしれませんが、ピクセルの 2 次元配列ではどのように行うのでしょうか?
  • 視覚的なパターンと数学的パターンに違いはありますか?
  • 画像内の一連の特徴とは対照的に、数列内のパターンを認識する方法に違いはありますか?

私が見つけた情報のほとんどは、私がまだ得ていない優れた数学的背景を必要とするため、これを理解する助けが本当に欲しい.

4

1 に答える 1

1

数学的パターンの認識と画像特徴の認識はどちらも同じタイプの「認識」を使用しますが、それぞれに特化したさまざまな実装があります。画像では、ピクセルの色 (例: 255,255,255) とその周囲のピクセルとの関係 (2 次元配列) を扱っています。

計算を容易にするために、ほとんどのアルゴリズムは次のように処理されます。

  • 各水平線を通過し、次に各垂直線を通過し、ピクセル差の配列を作成します (できれば L*a*b 色空間で)。
  • 次に、いくつかのパラメーターを微調整することで、x 方向と y 方向の両方で連続している一意の「オブジェクト」を分離できます。
  • オブジェクトの論理ツリーとその画像上の位置を作成します

少し違うことをしたい場合は、高速フーリエ変換を使用して、そこのパターンに従います。通常の数値パターンを使用している場合、原則は同じです。

于 2013-03-31T18:32:59.553 に答える