以前は多くの支援を受けましたが、別の問題に遭遇したばかりで、誰かが何か洞察を持っているかどうか疑問に思っていました.
以前の投稿で、データセットがあると書きました (実際には約 50 行あります)。これを「Times」と呼びましょう。
> Times <- read.csv(“Times.csv”, stringsAsFactors=FALSE, header=TRUE)
> Times
Num Start End
1 00:09:41 00:25:025
2 00:11:21 00:41:32
3 00:34:39 00:58:01
次に、重複する時間間隔を見つけるために、すべての行を比較してバンド マトリックスを作成するようにアドバイスされました。
Overlap <- outer (Times$Start, Times$End, function (x,y) y > x)
Overlap [upper.tri (Overlap) | col (Overlap) = = row(Overlap)] <- NA
Overlap
[,1] [,2] [,3]
[1,] NA NA NA
[2,] TRUE NA NA
[3,] FALSE TRUE NA
したがって、この時点で、どの行が重複しているかがわかりますが、理想的には、元のデータフレームに似た出力が必要ですが、他の行と重複しない行は除外します。
TRUE を含まない行を省略する方法はありますか? これをデータフレームに戻すことは可能ですか?
あなたが提供できる助けをありがとう!