0

次のデータセットとその欠落データに取り組んでいます。

# A tibble: 27 x 6
      id sex      d8   d10   d12   d14
   <dbl> <chr> <dbl> <dbl> <dbl> <dbl>
 1     1 F      21    20    21.5  23  
 2     2 F      21    21.5  24    25.5
 3     3 NA     NA    24    NA    26  
 4     4 F      23.5  24.5  25    26.5
 5     5 F      21.5  23    22.5  23.5
 6     6 F      20    21    21    22.5
 7     7 F      21.5  22.5  23    25  
 8     8 F      23    23    23.5  24  
 9     9 F      NA    21    NA    21.5
10    10 F      16.5  19    19    19.5
# ... with 17 more rows

Last Observation Carried Forward method (LOCF) と Next Observation Carried Backward method (NOCB) を介して欠落データを埋め、グラフィック表現も報告したいと考えています。性別ごとの各年齢での平均と標準誤差を計算します。plot() 関数で引数を適切に設定する方法を提案できますか?

誰かがこれについて何か手がかりを持っているかもしれませんか?

例として他のデータセットから引き出されたコードが有用であることが判明した場合に備えて、いくつかのコードを以下に示します。

par(mfrow=c(1,1))
Oz <- airquality$Ozone
locf <- function(x) {
  a <- x[1]
  for (i in 2:length(x)) {
    if (is.na(x[i])) x[i] <- a
    else a <- x[i]
  }
  return(x)
}
Ozi <- locf(Oz)
colvec <- ifelse(is.na(Oz),mdc(2),mdc(1))

### Figure

plot(Ozi[1:80],col=colvec,type="l",xlab="Day number",ylab="Ozone (ppb)")
points(Ozi[1:80],col=colvec,pch=20,cex=1)
4

1 に答える 1