次の形式のデータを使用して、R プログラミング言語で (年齢別の) 死亡率をどのように計算できますか?
head(data)
## age gender zone Class misc bonus duration death cost
## 1 0 M 1 4 12 1 0.1753 0 0
## 2 4 M 3 6 9 1 0.0000 1 0
## 3 5 F 3 3 18 1 0.4548 0 0
## 4 5 F 4 1 25 1 0.1726 0 0
## 5 6 F 2 1 26 1 0.1808 0 0
## 6 9 F 3 3 8 1 0.5425 0 0
つまり、年齢ごとに死亡者数を計算し、その特定の年齢で暴露された個人の総数で割ります。私は次のことを試しました:
n <- length(data$age);
rate <- c(1:n);
for (i in 1:n){
rate[i] <- sum(subset(data, age == i)$death)/ length(subset(data, age == i))
}
しかし、これは役に立ちませんでした-明らかに、1からnまでのすべての年齢がデータセットに存在するわけではありません-私は、上記の意味で仕事をする書かれたプログラムを探しています。