次のようにファイルを変換したいと思います。
入力:
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
.
.
.
優先出力:
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
LOC100132062,LOC100133331 0.37927964653622 0.434306394092769
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
ATAD3A,ATAD3B,ATAD3C 14.9379319811031 15.6244071876106 14.2514567745956
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
MMP23A,SLC35E2 1.23714660156378 0.99559795831378 1.47869524481378
つまり、各行に出現するすべての文字列(ここではコンマ)について、それをカウントしてから、同じ行をその出現回数だけ複製したいと思います。したがって、最初の行には1つのコンマがあるので、1回複製し、2番目の行には2つのコンマがあるので、その行を2回複製します。
理想的には、最初の列は元々コンマで区切られた一意の文字列になりますが、上記にも非常に満足しています。これには簡単な解決策が必要ですが、私には理解できないようです。