特定の範囲のセットでカバーされていないすべての範囲を定義する最良の方法は何だろうと思っています。たとえば、既知の座標を持つ一連の遺伝子がある場合:
dtGenes <- fread(
"id,start,end
1,1000,1300
2,1200,1500
3,1600,2600
4,3000,4000
")
染色体の全長が 10000 であることがわかっているとしましょう (簡単にするために、それらはすべて同じ染色体上にあると仮定します)。したがって、最終的に次の遺伝子間領域のリストがあると予想されます。
"startR,endR
0,1000
1500,1600
2600,3000
4000,10000
"
バイオコンダクターはIRange
ここで役に立ちますか? またはこれを解決する他の良い方法はありますか?