-1

こんにちは、何かが欠けていると本当に思いますが、データフレームでchisqを計算する方法がわかりません。テストのようなデータフレームがあり、chisq を計算して、カテゴリの頻度がセット全体と比較して高いかどうかを判断します。また、すべてのカテゴリで実行したいと考えています。

cat  <- c("aa","bb","cc","dd","aa","cc","bb","aa")
variable  <- c(1,1,0,1,0,0,0,1)
test <- as.data.frame(cbind(cat,variable))
testcast  <- dcast(test, cat~variable)
testcast.sum  <- matrix(c(1,2,3,2),ncol=2,byrow=T)
chisq.test(testcast.sum)

ご協力いただきありがとうございます!

4

1 に答える 1

-1

この chisq.test(table(cat,variable)) のように、カイ 2 乗検定を実行して、cat と変数の間の関連付けを確認できます。

「すべてのカテゴリで実行する」という意味がわかりません。

投稿した数値では、カイ二乗検定は適切な選択ではない可能性があることに注意してください (ここを参照してください: http://en.wikipedia.org/wiki/Pearson's_chi-squared_test#Problems )

于 2014-05-22T14:04:03.590 に答える