データを階層的クラスターツリーにグループ化できるアルゴリズムがあります。このアルゴリズムは、TobySeagramのProgrammingCollectiveIntelligenceで説明されているものです。ツリー出力は、各ノードに「距離」値を持つ2分木であり、2つの子ノードがどれだけ離れているかを示します。
次に、これを樹状図として表示できます。これにより、値がグループ化されている人間のスポットがかなり簡単になります。ただし、グループを自動的に決定するアルゴリズムを思い付くのは困難です。自動的に判断できるようにしたいと思います。
- グループの数
- 各グループにどのポイントを配置する必要がありますか
このための標準的なアルゴリズムはありますか?