このようなタブ区切りのファイルがあります
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
ATP13A2
ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
PQLC2
PQLC2
AKR7A2
PQLC2
column4 の値が繰り返される行を削除する必要があります。
最初の 3 つの列は座標であり、それらの座標には、見つかったものはすべて (col4 に) リストされています。各座標には、名前の繰り返しではなく、一意の名前のみを付けたいと考えています。
このような出力が欲しい
chr1 12226559 12227059 TNFRSF1B
chr1 17051560 17052060
chr1 17053279 17053779
chr1 17338423 17338923 ATP13A2
chr1 19577574 19578074 EMC1
MRTO4
chr1 19578046 19578546 EMC1
MRTO4
chr1 19638239 19638739 AKR7A2
PQLC2
私が試したこと
sort -k 4 -u file
awk '{if($4==temp1){next;}else{print}temp1=$4}' file
何も機能しません:(
助けてください
ありがとうございました