KD ツリーは最近傍検索に最適であると常に宣伝されています。ただし、データ セットがすべて離散値であり、実際の距離メトリックがない場合でも、それらは効率的でしょうか?
たとえば、属性が[black, blue, red], [bread, milk, cheese], [right, left, straight, curved]
連続性がなく、距離を測定する唯一の方法がハミング距離のようなものである場合 (テスト例と同等の数を確認します)。これらのシナリオでも KD ツリーは有効に機能しますか? どうして?