2

累積カウントを行いたいバイナリ ベクトルを含むデータ フレームがあります。ただし、個々の 1 ではなく「1 のグループ」をカウントし、0 の区切り値を保持しながら、このカウントの新しいベクトルを作成したいと思います。すなわち

df1 <- data.frame(c(0,1,1,1,1,0,0,0,1,1,1,1,1,0,0,0,1,1,1)

n   bin
1    0
2    1
3    1
4    1
5    1
6    0
7    0
8    0
9    1
10   1
11   1
12   1
13   1
14   0
15   0
16   0
17   1
18   1
19   1 

になる

n   bin cumul
1    0     0
2    1     1
3    1     1
4    1     1
5    1     1
6    0     0
7    0     0
8    0     0
9    1     2
10   1     2
11   1     2
12   1     2
13   1     2
14   0     0
15   0     0
16   0     0
17   1     3
18   1     3
19   1     3

どうすればいいですか?

4

3 に答える 3

3

rleidパッケージ data.tableの関数を使用できます。

df1 <- data.frame(bin = c(0,1,1,1,1,0,0,0,1,1,1,1,1,0,0,0,1,1,1))
library(data.table)
setDT(df1)
df1[, cumul := rleid(bin)]
df1[bin == 0, cumul := 0]                  
df1[bin == 1, cumul := rleid(cumul)]  
#    bin cumul
# 1:   0     0
# 2:   1     1
# 3:   1     1
# 4:   1     1
# 5:   1     1
# 6:   0     0
# 7:   0     0
# 8:   0     0
# 9:   1     2
#10:   1     2
#11:   1     2
#12:   1     2
#13:   1     2
#14:   0     0
#15:   0     0
#16:   0     0
#17:   1     3
#18:   1     3
#19:   1     3
于 2016-02-05T15:27:53.933 に答える
2

なんとなく手動ですが:

l <- rle(df1$c1)$lengths
v <- rle(df1$c1)$values
v2 <-  cumsum(v)
v2[duplicated(v2)] <- 0

df1$cumul <- rep(v2, times = l)
df1
   c1 cumul
1   0     0
2   1     1
3   1     1
4   1     1
5   1     1
6   0     0
7   0     0
8   0     0
9   1     2
10  1     2
11  1     2
12  1     2
13  1     2
14  0     0
15  0     0
16  0     0
17  1     3
18  1     3
19  1     3
于 2016-02-05T15:26:18.330 に答える