regex - 用語が最初に見つかったときに基づいて行全体を grep します

Question

かなり大きなソート済みファイル (4 列目、次に 3 列目) を検索し、4 列目に初めて新しい単語が見つかった時点を見つけて、行全体を新しいファイルに出力したいと考えています。たとえば、私のファイルは次のようになります。

c1 23 1912 PE_1.7
c1 25 2334 PE_1.7
c1 59 2340 PE_1.7
c1 28 2342 PE_1.7
c1 30 2345 PE_1.7
c1 45 2346 PE_1.7
c1 23 2348 PA_11.4
c1 24 2352 PA_11.4
c1 57 2362 PA_123.2
c1 26 2372 DA_1.5

そして、新しいファイルが次のようになることを願っています。

c1 23 1912 PE_1.7
c1 23 2348 PA_11.4
c1 57 2362 PA_123.2
c1 26 2372 DA_1.5

私は正規表現で腐っていますが、次の行に沿って何かを考えていました:

grep \t.[_].[\.]$

このタイプの grep を実行する良い方法はありますか? いわば間違ったツリーを吠えていますか?

score 1 · Accepted Answer

これを試して：

$ awk '!x[$4]++' file
c1 23 1912 PE_1.7
c1 23 2348 PA_11.4
c1 57 2362 PA_123.2
c1 26 2372 DA_1.5

regex - 用語が最初に見つかったときに基づいて行全体を grep します

4 に答える 4

Related

Reference