-1

Rを使ってco-occurrencesというキーワードでデータをクラスタリングしたいと思っています

  1. 単語の階層レベルが異なる
  2. キーワードは必ずしも順序または階層レベルで表示されるとは限りません

Keywords
Food;Fruit;Banana
Food;Fruit;Apple
Fruit;Food;Orange
Food;Bread;Toast
Food;Bread;Whole Grain
Bed;Bedroom;Furniture
Furniture;Bedroom;Bed
Furniture;Living Room;Chair
Furniture;Bedroom;Chair

結果として、最初のレベルでキーワードが食品と家具に分岐するようにしたいと考えています。2 番目と 3 番目には、ベッドルーム、リビング ルームなどのサブブランチがあります。次のような階層クラスター分析を使用する場合

hc <- hclust(dist(data))
plot(hc)

最下層のカテゴリの 1 つとして「家具」になりますが、私の例では「節点」です。

これを解決する機能はありますか?

ベスト・ピート

4

2 に答える 2

1

コメントするには長すぎますが、探しているものではないかもしれません:

df <- read.csv2(header=F, comment.char="#", text="
Food;Fruit;Banana
Food;Fruit;Apple
#Fruit;Food;Orange
Food;Bread;Toast
Food;Bread;Whole Grain
#Bed;Bedroom;Furniture
Furniture;Bedroom;Bed
#Furniture;Living Room;Chair
Furniture;Bedroom;Chair")

library(data.tree)
df$pathString <- with(df, paste("root", V1, V2, V3, sep="/"))
dt <- as.Node(df)
dt
#                  levelName
# 1  root                   
# 2   ¦--Food               
# 3   ¦   ¦--Fruit          
# 4   ¦   ¦   ¦--Banana     
# 5   ¦   ¦   °--Apple      
# 6   ¦   °--Bread          
# 7   ¦       ¦--Toast      
# 8   ¦       °--Whole Grain
# 9   °--Furniture          
# 10      °--Bedroom        
# 11          ¦--Bed        
# 12          °--Chair  

data.tree ビネットを見てください。

于 2015-12-09T16:03:42.457 に答える