Rを使ってco-occurrencesというキーワードでデータをクラスタリングしたいと思っています。
- 単語の階層レベルが異なる
- キーワードは必ずしも順序または階層レベルで表示されるとは限りません
例
Keywords
Food;Fruit;Banana
Food;Fruit;Apple
Fruit;Food;Orange
Food;Bread;Toast
Food;Bread;Whole Grain
Bed;Bedroom;Furniture
Furniture;Bedroom;Bed
Furniture;Living Room;Chair
Furniture;Bedroom;Chair
結果として、最初のレベルでキーワードが食品と家具に分岐するようにしたいと考えています。2 番目と 3 番目には、ベッドルーム、リビング ルームなどのサブブランチがあります。次のような階層クラスター分析を使用する場合
hc <- hclust(dist(data))
plot(hc)
最下層のカテゴリの 1 つとして「家具」になりますが、私の例では「節点」です。
これを解決する機能はありますか?
ベスト・ピート