データ ポイントのセットを指定すると、kdtreeが作成されますが、この kdtree は一意のものですか?
3 に答える
ツリーの作成方法に依存するようです。ウィキペディアの記事では、中間点の選択が、生成されたツリーのバランスが取れているかどうかにどのように影響するかについて言及しています。別のポイントが選択された場合、ツリーはバランスが取れていませんが、kd ツリーのままです。したがって、質問に対する答えは、ツリー構築アルゴリズムが分割面をどのように選択するかによって異なります。
私はそうは思わない。
あなたの質問に対する答えが「はい」の場合、それは、各分割のディメンションと値の選択が客観的な基準によって選択されたことを意味すると思います。もちろん、値は正確なアルゴリズムに従って選択されます (つまり、その次元で分割されるすべてのポイントの中央値を計算しますが、次元ではありません。ほとんどの KD-Tree アルゴリズムは、使用可能な次元を交互に切り替えるだけで、分割する次元を選択します。一部のアルゴリズムは、分割するディメンションをランダムに選択するだけです。
これは C4.5 (デシジョン ツリー) とは大きく異なります。これは、分割する次元と値が客観的な基準、つまりエントロピーの最小化 (カテゴリ変数の場合) または分散 (連続変数の場合) によって選択されるためです。
データセット内のデータの順序に関係なく、特定の分割方法が選択された場合、それは一意である、または安定していると呼びます。