各行に 1 つ以上の電子メール ID を持つテキスト ファイルがあります。例えば
id:123, name:test, id: 5678, name john, address:new york
id:567, name:bob
id:3643, name:meg, id: 6721, name kate, address:la
ここでの問題は、id:value が 1 行に 1 回以上表示される可能性があることです。出力が次のようになるように、すべての id:value ペアを抽出するにはどうすればよいですか?
id:123, id:5678
id:567
id:3643, id:6721
私は試しegrep -o
ましたが、それは各id:value
ペアを別々の行に入れています.
sed/awk
トリックを行う必要がありますが、私は初心者です
Perl
Perl のインストールが必要になるため、使用したくありません。
編集:
データ ファイルをさらに分析すると、一貫性のない区切り記号が表示されます。つまり、すべての行が,
区切られているわけではありません。と で区切られているものも:
あり|
ます。また、,
アドレス値フィールド内に表示されます。すなわちaddress:52nd st, new york
。awk
これは正規表現を使用して行うことができますか?