次のようなファイルがあるとします。
apple 2018-01-01
apple cider 2018-01-05
apple cider 2017-01-06
lemon 2016-12-30
lemon 2017-12-31
lemon juice 2018-03-12
lemon pie 2018-03-30
つまり、1 つ以上のテキスト列と日付があります。また、いくつかのテキスト エントリは [異なる] 日付で重複しています。ここで、これらの重複を削除します。
apple 2018-01-01
apple cider 2017-01-06
lemon 2016-12-30
lemon juice 2018-03-12
lemon pie 2018-03-30
1 つの列にある場合は、このソリューションを使用できます。しかし、特定の列を検索する代わりに、正規表現を使用して重複を検索する必要がある場合はどうすればよいでしょうか? これを処理できますawkか?または、他の回避策はありますか?
ありがとう。