txtファイルのデータ操作に問題があります。私のファイルは現在次のようになっています:
HG02239 -23.42333333
NA06985NA06985 -20.125
NA06991NA06991 -20.92
これは、タブ区切りのデータの一部を示しています。エントリの半分は正しい7文字(letterletternumbernumbernumbernumbernumbernumber)形式ですが、一部は2倍になっています。2番目の列(最初の列は理由で空です!)に移動し、文字列の繰り返しを削除して、次のようにします
HG02239 -23.42333333
NA06985 -20.125
NA06991 -20.92
列ごとにsed/awkでこれを行う方法を理解できません。正規表現を記述できるはずですが、データが繰り返しであるため、文字列の前半を失いたくありません。特定の列を切り取る方法がわからないか、7番目の文字を削除するだけです。どんな助けでも大歓迎です!