フィールド 1 の可変長キー フィールドとフィールド 2 のその他のデータで構成されるテキスト ファイルがあります。フィールドはタブ文字 ("\t") で区切られています。キー フィールドにはスペースが含まれています。ファイルはキー フィールドでソートされます。
これをフィルタリングして、重複するキー フィールド (つまり、フィールド 1) を持つレコードのみを含むファイルを作成し、レコードのグループを空白行で区切るという利点を追加したいと思います。
例えば
01001|XYZ ZY|\tFOO MAN CHU\n
01001|XYZ ZY|\tBAR BAZ\n
01001|ZZZYYYXX|\tYACKETY YACK\n
01001|ZZZYYYXX|\tBOBBITY BOP\n
01001|ZZZYYYXX|\tTESTING TESTING\n
...等。言い換えれば、uniq -d -D
代替フィールド区切り文字または可変長フィールドのオプションを提供した場合、正確にはどうなるでしょうか!
既製の Unix フィルターを使用してコマンドでこれを達成する方法はありますか?