4 列のタブ区切りファイルがあります。「col1」と「col2」の一意の値のペアごとに「col3」と「col4」を組み合わせる必要があります。例と出力を以下に示します。
私が考えている 1 つの方法は、ネストされたループを使用することです。外側のループは行を順番に読み取り、内側のループは最初からすべての行を読み取り、マップを探します。ただし、このプロセスは計算量が多いようです。
これを行う別の方法はありますか。
col1 col2 col3 col4
a c 1,2 physical
a c 2,3 genetic
b c 22 physical
b d 33,44 genetic
c e 1,2 genetic
c e 2 physical
c f 33,44 physical
c f 3 genetic
a a 4 genetic
e c 1,2 xxxxx
col1 col2 col3 col4
a c 1,2,3 genetic,physical
a a 4 genetic
b c 22 physical
b d 33,44 genetic
c e 1,2 genetic,physical,xxxxx
c f 3,33,44 genetic,physical
上記の最後の行のように「col1」と「col2」が値「xxxxx」で入れ替わると、値が結合されます。