複数の被験者について繰り返し観測を測定した時系列データがあります。positive == 1
被験者ごとに変数が発生する回数を計算したいと思います(変数id
)。
2 番目の目的は、これらの連続観測の実行の最大長を特定することですpositive == 1
。各被験者について、研究期間内に複数回実行される可能性があります。被験者ごとに連続した肯定的な観察の最大数を計算するのではなく、個々の実行内の最大実行長を計算したいと思います。
問題を説明するおもちゃのデータセットを次に示します。
set.seed(1234)
test <- data.frame(id = rep(1:3, each = 10), positive = round(runif(30,0,1)))
test$run <- sequence(rle(test$positive)$lengths)
test$run_positive <- ifelse(test$positive == '0', '0', test$run)
test$episode <- ifelse(test$run_positive == '1', '1', '0')
count(test$episode)
x freq
1 0 25
2 1 5
上記のコードは、肯定的なエピソードの数を数えようとしている最初の質問への回答に近づいていますが、件名によって条件付けられていません。これは、被験者 #1 の最後の観測と被験者 #2 の最初の観測を同じ実行でカウントするという残念な結果をもたらします。サブジェクトごとにこのランレングスのエンコーディングを調整するコードを開発するのを手伝ってくれる人はいますか?
第二に、各ランの最大ラン長のみをどのように抽出できpositive == 1
ますか? 最大ランレングスが記録された観測のみが記録される追加の列を追加したいと思います。サブジェクト #1 の場合、これは次のようになります。
id positive run run_positive episode max_run
1 1 0 1 0 0 0
2 1 1 1 1 1 0
3 1 1 2 2 0 0
4 1 1 3 3 0 0
5 1 1 4 4 0 0
6 1 1 5 5 0 5
7 1 0 1 0 0 0
8 1 0 2 0 0 0
9 1 1 1 1 1 0
10 1 1 2 2 0 2
誰かがこれを行う方法を思い付くことができれば、私は非常に感謝しています.