実行ポイントを示すサフィックスが異なるだけで多数の重複エントリを作成するアプリケーション用のログ ファイル要約ツールを作成しようとしています。
infile_grocery.txt
一般化されたバージョンは次のとおりです。これらのコンテンツを含む text_file ( )。
milk skim fruit apple banana
milk skim fruit orange
milk skim fruit mango
milk skim fruit pomegranate
milk 2 percent fruit cherry tomato
milk 2 percent fruit peach
milk whole fruit pineapple
milk skim fruit strawberry raspberry
milk skim fruit strawberry rhubarb
milk whole fruit pineapple
私が得たいと思っているのは:
milk skim fruit apple banana, orange, mango, pomegranate
milk 2 percent fruit cherry tomato, peach
milk whole fruit pineapple
milk skim fruit strawberry raspberry, strawberry rhubarb
milk whole fruit pineapple
私が現在作成したコマンドラインは次のとおりです。
sed -rn "{H;x;s|^(.+) fruit ([^\n]+)\n(.*)\1 fruit (.+)$|\1 fruit \2, \4|;x}; ${x;s/^\n//;p}" infile_grocery.txt
しかし、私が得ている結果は次のとおりです。
milk skim fruit apple banana, mango, strawberry raspberry
milk skim fruit strawberry rhubarb
milk whole fruit pineapple
どういうわけか入力を破棄しています。これをどのように構築するかについてより良いアイデアを持っている教祖はいますか?