テキストファイルの行を一致する最初のフィールドと一致させるための高速で簡潔な方法は何ですか。
サンプル入力:
a|lorem
b|ipsum
b|dolor
c|sit
d|amet
d|consectetur
e|adipisicing
e|elit
望ましい出力:
b|ipsum
b|dolor
d|amet
d|consectetur
e|adipisicing
e|elit
望ましい出力、代替:
b|ipsum|dolor
d|amet|consectetur
e|adipisicing|elit
これを書く方法はたくさん想像できますが、たとえば sed や awk などを使って行うスマートな方法があるのではないかと思います。私のソース ファイルは約 0.5 GB です。
ここには関連する質問がいくつかあります。たとえば、「awk | フィールドの一致に基づいて行をマージする」ですが、他の質問はメモリにあまりにも多くのコンテンツをロードします。ストリーミング方法が必要です。