複数の列にわたるカイ二乗統計の使用dplyr
と計算について質問があります。reshape2
以下は小さなデータフレームです...
Sat <- c("Satisfied","Satisfied","Dissatisfied","Dissatisfied",
"Neutral")
Gender <- c("Male","Male","Female","Male","Female")
Ethnicity <- c("Asian","White","White","Asian","White")
AgeGroup <- c("18-20","18-20","21-23","18-20","18-28")
Example <- data.frame(Sat,Gender,Ethnicity,AgeGroup)
summarise_each
他の各変数に対して列を使用またはmelt
計算してSat
、カイ二乗残差と p 値の統計を生成するにはどうすればよいですか。私は次のようなものがあるに違いないと考えています:
Example %>% summarise_each(funs(chisq.test(...
しかし、私はそれを終了する方法がわかりません。また、どのようにデータ フレームを溶かして、カイ 2 乗統計を使用group_by
または取得しますか? do()
両方の方法に興味があります。パッケージを組み込む方法があれば、それも素晴らしいbroom
でしょう。tidyr
reshape2
要約すると、次のようなカイ二乗検定を実行したいと思います
chisq.test(Example$Sat, Example$Gender)
しかし... 、、およびSat
に対する変数のカイ二乗統計を生成したいと思います。これは小さな例です。上記の方法を使用して、多くの列のカイ 2 乗統計を高速かつ効率的に作成できることを願っています。を使用してヒート マップに残差をプロットできればボーナスです。そのため、パッケージをこの例に組み込むことに関心があります。Gender
Ethnicity
AgeGroup
ggplot2
broom