次の形式の何百万行ものファイルがあります。
SN608 VB050 1 1113 1699.50 2339.90 0 1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACCCGTCAATTTTTTAAAAAAAACCCCCGGGGGGTAGTTTGTTAAAA a[_ceeeegggfgiiigecccccccccccccccccccccbcccccccccccTTEHGGHHGJHGJSRGEGGJY]]]TX[[[XEEOX[EEEGGJGGGGJS] 1
を使用して、列 9 で並べ替えましたsort -k9。列 9 は 100 文字の文字列ですが、一部のエントリにはピリオドが含まれる場合があります。ここで、列 9 の 100 文字の文字列が 1 回または 2 回 (<3 回) しか発生しない行を削除し、他のすべての行をファイルに保存します。
uniq私は( -d -f9 -w100) で遊んで、役に立つsortとawk思いますが、初心者すぎてこれを理解できません。