データフレーム内で行ごとに集計したいと思います。次の例では、table
withinを使用して適切な結果を得ることができます。apply
df.1 <- read.table(text = '
state county city year1 year2 year3 year4 year5
1 2 4 0 0 0 1 2
2 5 3 10 20 10 NA 10
2 7 1 200 200 NA NA 200
3 1 1 NA NA NA NA NA
', na.strings = "NA", header=TRUE)
tdf <- t(df.1)
apply(tdf[4:nrow(tdf),1:nrow(df.1)], 2, function(x) {table(x, useNA = "ifany")})
結果は次のとおりです。
[[1]]
x
0 1 2
3 1 1
[[2]]
x
10 20 <NA>
3 1 1
[[3]]
x
200 <NA>
3 2
[[4]]
x
<NA>
5
ただし、次の例では、各行は単一の値で構成されています。
df.2 <- read.table(text = '
state county city year1 year2 year3 year4 year5
1 2 4 0 0 0 0 0
2 5 3 1 1 1 1 1
2 7 1 2 2 2 2 2
3 1 1 NA NA NA NA NA
', na.strings = "NA", header=TRUE)
tdf.2 <- t(df.2)
apply(tdf.2[4:nrow(tdf.2),1:nrow(df.2)], 2, function(x) {table(x, useNA = "ifany")})
私が得る出力は次のとおりです。
# [1] 5 5 5 5
そのため、この出力から、最初の 5 が 0、2 番目の 5 が 1、3 番目の 5 が 2、最後の 5 が NA であることがわかりません。2 番目の例の各 5 で表される値を R に返す方法はありますか?