r - グループ平均とカイ 2 乗の比較

Question

データ内のグループ平均の差が統計的に有意かどうかを確認したいと思います。

このような長い形式のデータでカイ二乗検定を実行するにはどうすればよいですか

Country        Year     Value
Country A       1         2
Country A       2         3
Country A       3         3
Country B       1         6
Country B       2         7
Country B       3         6
Country C       1         9
Country C       2         8
Country C       3         9

同じ変数で異なるグループ (国) に対してカイ 2 乗検定を実行する方法がわかりません。

ありがとう

score 1 · Accepted Answer

このようなほとんどの統計テストでは、データをロングフォーマットから適切なワイドフォーマットに再フォーマットする必要があります。reshape2こういったことを手助けしてくれるパッケージが好きです。

例えば：

> x <- read.table(text = "Country        Year     Value
+ Country.A       1         2
+ Country.A       2         3
+ Country.A       3         3
+ Country.B       1         6
+ Country.B       2         7
+ Country.B       3         6
+ Country.C       1         9
+ Country.C       2         8
+ Country.C       3         9", header = TRUE)
> 
> 
> library(reshape2)
> wide <- dcast(x, Country ~ Year, value.var = "Value")
> wide
    Country 1 2 3
1 Country.A 2 3 3
2 Country.B 6 7 6
3 Country.C 9 8 9

chisq.test()これで、実行したいテストやその他のテストに必要な形式に近づきました。最初の行には Country 列が含まれており、これはカウントには関係ないため、分析から除外する必要がある可能性が最も高いです。

> wide[, -1]
  1 2 3
1 2 3 3
2 6 7 6
3 9 8 9

どのテストがあなたのデータに適しているかを判断するのはあなたに任せます。

score 0 · Accepted Answer

検定する仮説が指定されていないため、「カイ 2 乗検定」を適用することはまだできません。（実装に関して不確かな特定のケースを指定しているという事実は、彼が宿題である可能性があることを示唆しています。）提供するデータから、行がまったく独立していないことはかなり明らかです。3 つの国しかなく、整数値を持つものの連続した時間間隔で測定が繰り返されます。それらはカウントですか？これが議論の目的でより豊富なデータセットを単純化するための努力である場合、実質的なコメントを提供できるように、質問を修正し、現実的なテストケースの構築にある程度の努力を払う必要があります

r - グループ平均とカイ 2 乗の比較

2 に答える 2

Related

Reference