R iRanges で重複する範囲を一般的に見つけることに関する他の投稿を見つけましたが、この余分なちょっとしたひねりを手伝ってもらえますか: リンクされている 2 つの範囲 (開始範囲と終了範囲を持つゲノム再編成の可能性) があり、マザーゲノムの同じ範囲を除外する
以下のように停止と開始の範囲を見つけました (chr 番号、間隔の開始、間隔の終了)。左側の 3 列は再配置の開始を示し、右側の 3 列は再配置の終了を示します (それらはSVDetect と呼ばれるプログラムの出力であり、NGS データを使用して参照ゲノムとの異常なアラインメントを持つメイト ペアを検出します)。母クローンと娘の 2 つのゲノムがあり、娘に固有の再編成を見つけたいと考えています = 両方の範囲が別の範囲の 2 つの範囲の同じ行と重複する行を除外したいと考えています。範囲は少し異なるかもしれませんが、両方の範囲が重なっている場合は、再編成が母親にすでに存在していたことを強く示しています.
娘:
1 1384138 1384862 - 1 516731 516918
2 3758860 3759278 - 2 879828 879966 # (filter away this line as overlap with below)
2 3940051 3940470 - 2 3940856 3941250
母親:
2 3758858 3759282 - 2 879828 879966 # (overlap with this range)
1 1384138 1384862 - 3 116231 516918
2 3940051 3940470 - 3 1540856 3941250