r - R - データセットの完全同時確率分布を返す

翻译自：https://stackoverflow.com/questions/20547027 2013-12-12T15:07:06.547

1505 次

以下のように、カテゴリ変数を持つ data.frame があります。

bird.data <- data.frame( id =  rep(2,500),
                          colour = sample(c("Red", "Blue", "Yellow", "Green"), 500, replace=T, c(0.15,0.45, 0.20, 0.20)),
                          size = sample(c("Large", "Medium","Small"), 500, replace = T, c(0.33,0.33, 0.33)),
                          texture = sample(c("Hard", "Soft"), 500, replace = T, prob = c(0.55,0.45))
)

P(colour,size,texture)Rを使用してデータセットの完全な共同分布を返す簡単な方法はありますか? 上記のデータセットの場合、これは次元を持つ立方体になります: with(bird.data, levels(colour) * levels(size) * levels(texture)).

たとえば、上記のデータセットの場合、キューブ内に以下のようにすべての情報を格納できるようにしたいと考えています。

# P(colour="Red", size="Small", texture= "Hard")
p_Red_Small_Hard <- nrow(bird.data[ bird.data$colour== "Red" & bird.data$size == "Small" & bird.data$texture =="Hard", ]) / nrow(bird.data)

r - R - データセットの完全同時確率分布を返す

0 に答える 0

Related

Reference