この問題を解決するために findOverlap を使用しようとしましたが、条件なしでオーバーラップ領域のみを見つけたので、データを選択する条件があれば。どうすればいいですか?
以下のような2つのデータフレームがあるとしましょう
データフレーム
Sample, start, stop, event, probe, length, length/probe, region
CNV1234, 2000, 3000, CN gain, 23, 235, 9, intron
CNV1534, 1200, 1800, CN loss, 60, 600 10, exon
データフレームb
Sample, start, stop, event, probe, length, length/probe, region
CNV234, 2500, 3500, CN gain, 23, 235, 9, exon
CNV34, 1200, 1800, CN loss, 60, 600 10, intron
2つの質問があります
まず、CNVの長さが50%を超えており、このオーバーラップがイントロン領域にあるこの2つのデータフレーム間のオーバーラップを見つけたい
次に、オーバーラップ領域の長さを知りたいです。
結果を次のようなデータフレームにしたい
Sample, start, stop, event, probe, length, length/probe, region, overlap, length of overlap
CNV1234, 2000, 3000, CN gain, 23, 235, 9, intron, CNV234, 500