0

データ内のグループ平均の差が統計的に有意かどうかを確認したいと思います。

このような長い形式のデータでカイ二乗検定を実行するにはどうすればよいですか

Country        Year     Value
Country A       1         2
Country A       2         3
Country A       3         3
Country B       1         6
Country B       2         7
Country B       3         6
Country C       1         9
Country C       2         8
Country C       3         9

同じ変数で異なるグループ (国) に対してカイ 2 乗検定を実行する方法がわかりません。

ありがとう

4

2 に答える 2

1

このようなほとんどの統計テストでは、データをロング フォーマットから適切なワイド フォーマットに再フォーマットする必要があります。reshape2こういったことを手助けしてくれるパッケージが好きです。

例えば:

> x <- read.table(text = "Country        Year     Value
+ Country.A       1         2
+ Country.A       2         3
+ Country.A       3         3
+ Country.B       1         6
+ Country.B       2         7
+ Country.B       3         6
+ Country.C       1         9
+ Country.C       2         8
+ Country.C       3         9", header = TRUE)
> 
> 
> library(reshape2)
> wide <- dcast(x, Country ~ Year, value.var = "Value")
> wide
    Country 1 2 3
1 Country.A 2 3 3
2 Country.B 6 7 6
3 Country.C 9 8 9

chisq.test()これで、実行したいテストやその他のテストに必要な形式に近づきました。最初の行には Country 列が含まれており、これはカウントには関係ないため、分析から除外する必要がある可能性が最も高いです。

> wide[, -1]
  1 2 3
1 2 3 3
2 6 7 6
3 9 8 9

どのテストがあなたのデータに適しているかを判断するのはあなたに任せます。

于 2012-04-02T22:22:17.283 に答える
0

検定する仮説が指定されていないため、「カイ 2 乗検定」を適用することはまだできません。(実装に関して不確かな特定のケースを指定しているという事実は、彼が宿題である可能性があることを示唆しています。)提供するデータから、行がまったく独立していないことはかなり明らかです。3 つの国しかなく、整数値を持つものの連続した時間間隔で測定が繰り返されます。それらはカウントですか?これが議論の目的でより豊富なデータセットを単純化するための努力である場合、実質的なコメントを提供できるように、質問を修正し、現実的なテストケースの構築にある程度の努力を払う必要があります

于 2012-04-02T22:26:46.203 に答える