私はdf好きです:
SampleID Chr Start End Strand Value
1: rep1 1 11001 12000 - 10
2: rep1 1 15000 20100 - 5
3: rep2 1 11070 12050 - 1
4: rep3 1 14950 20090 + 20
...
chrそして、同じandを共有する行と、同様の開始点と終了点を持つ行を結合したいと考えてstrandいます (たとえば、100 +/- 距離のように)。行結合が実行される列については、SampleID名前とValue. 前の例では、次のようになります。
SampleID Chr Start End Strand Value
1:rep1,rep2 1 11001 12000 - 10,1
2: rep1 1 15000 20100 - 5
4: rep3 1 14950 20090 + 20
...
アイデア?ありがとう!
編集:
R の fuzzyjoin パッケージを見つけました ( https://cran.r-project.org/web/packages/fuzzyjoin/index.html )。誰もこのパッケージの経験がありますか?
EDIT2:
また、変数 (SampleIDまたはValue) の 1 つだけが連結されると便利です。