次のデータセットとその欠落データに取り組んでいます。
# A tibble: 27 x 6
id sex d8 d10 d12 d14
<dbl> <chr> <dbl> <dbl> <dbl> <dbl>
1 1 F 21 20 21.5 23
2 2 F 21 21.5 24 25.5
3 3 NA NA 24 NA 26
4 4 F 23.5 24.5 25 26.5
5 5 F 21.5 23 22.5 23.5
6 6 F 20 21 21 22.5
7 7 F 21.5 22.5 23 25
8 8 F 23 23 23.5 24
9 9 F NA 21 NA 21.5
10 10 F 16.5 19 19 19.5
# ... with 17 more rows
Last Observation Carried Forward method (LOCF) と Next Observation Carried Backward method (NOCB) を介して欠落データを埋め、グラフィック表現も報告したいと考えています。性別ごとの各年齢での平均と標準誤差を計算します。plot() 関数で引数を適切に設定する方法を提案できますか?
誰かがこれについて何か手がかりを持っているかもしれませんか?
例として他のデータセットから引き出されたコードが有用であることが判明した場合に備えて、いくつかのコードを以下に示します。
par(mfrow=c(1,1))
Oz <- airquality$Ozone
locf <- function(x) {
a <- x[1]
for (i in 2:length(x)) {
if (is.na(x[i])) x[i] <- a
else a <- x[i]
}
return(x)
}
Ozi <- locf(Oz)
colvec <- ifelse(is.na(Oz),mdc(2),mdc(1))
### Figure
plot(Ozi[1:80],col=colvec,type="l",xlab="Day number",ylab="Ozone (ppb)")
points(Ozi[1:80],col=colvec,pch=20,cex=1)