私のテキストファイルはアルファベット順にソートされています。各行が次の行に含まれているかどうかを確認し、含まれている場合は最初の行を削除します。たとえば、もし私が持っていたら...
car
car and trailer
train
…で終わりたい…
car and trailer
train
重複行を検索するコードを含む「sed one-liners」ページを見つけました。
sed '$!N; /^(.*)\n\1$/!P; D'
...そして、^を削除するとうまくいくと思いましたが、そうではありませんでした。
(連続していない行でこれを行うこともできますが、私のファイルは数千行に及ぶため、おそらくスクリプトの実行に数時間または数日かかるでしょう。)