特定の場所 (足場) のセグメントの初期位置と最終位置を含むデータ セットがあります。これらのセグメントの一部は、同じ足場にある場合、他のセグメントと重複しています。
> head(jobs)
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1502
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 1255 1499
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
2 PRJNA179522 Contig783 822 1073
2 つのことが必要です。1 つ目は、すべての個々の足場で重複する領域をすべて見つけることです。2 つ目は、各「新しい」セグメントの最初と最後の位置のみを含む新しいテーブルを取得することです。出力は次のようになります。
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
前もって感謝します。