0

乱数の1次元セットが与えられた場合、そのセットを調べて、データをツリーにプッシュします。一次元では、これは非常に単純です。データの値を比較するだけで、データがツリーのどこに伝播するかを決定できます。

ただし、高次元の場合、距離がぼやけ始め、ツリーのどこにどのデータを配置するかを決定するのがより困難になります。

実際、高次元ベクトルのセット(たとえば、128次元のSIFT機能)を含む階層ツリーを設計する場合、各n次元ベクトルのどれをどのサブツリーに移動するかなどをどのように決定できますか?私たちがしていることのいくつかは何ですか?

4

1 に答える 1

1

ランダムな木

ランダムツリーは、分類またはクラスタリングの一般的な手法です。

ツリーの各ノードを分割する方法を決定する方法は次のとおりです。

  • 128個のSIFT次元からランダムなk(5などの小さなもの)を選択します。
  • これらのk次元のうち、データの最適な分割を提供するものを決定します。

したがって、各ノードは以下を格納する必要があります。

  1. 使用する寸法
  2. そのディメンションに適用する決定しきい値

葉は保存されます:

  • クラス予測、またはそのリーフノードに到達したデータポイントに関する統計。
于 2012-12-18T07:01:52.553 に答える