cats
私は、ビルド内の R データセットであるfromm から派生した 2 つのデータセットに取り組んでいます。
> cats
Sex Bwt Hwt
1 F 2.0 7.0
2 F 2.0 7.4
3 F 2.0 9.5
4 F 2.1 7.2
5 F 2.1 7.3
6 F 2.1 7.6
7 F 2.1 8.1
8 F 2.1 8.2
9 F 2.1 8.3
10 F 2.1 8.5
11 F 2.1 8.7
12 F 2.1 9.8
...
137 M 3.6 13.3
138 M 3.6 14.8
139 M 3.6 15.0
140 M 3.7 11.0
141 M 3.8 14.8
142 M 3.8 16.8
143 M 3.9 14.4
144 M 3.9 20.5
男性標本と女性標本の Bwt 間の平均値の差に関する 99% 信頼区間を見つけたい(それぞれ性別 == M と性別 == F)
t.test
とりわけ、これが行われることはわかっていますが、男性と女性cats
を含む 2 つのデータセットBwt
に分割すると、t.test() は 2 つのデータセットの長さが同じではないと不平を言いますが、これは事実です。には女性が 47 人cats
、男性が 87 人しかいません。
他の方法で実行できますか、それともデータを分割して誤解していますか?
編集: データセットの平均の CI を取得する別の質問の回答者によって提案された関数があり、便利になる場合があります。
ci_func <- function(data, ALPHA){
c(
mean(data) - qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data)),
mean(data) + qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data))
)
}