linux - 2 つのテキストファイル間で同じ部分を見つける方法は?

Question

A と B の 2 つのテキストファイルには、改行またはスペース区切りで区切られた複数の単語項目が含まれています。ここで、A と B を比較し、2 つのファイルで同じ項目を見つけて、bash で A から削除します。何か良いアイデアはありますか?

score 3 · Accepted Answer

アルフェの答えは正しいようです。ただし、出力ファイルの単語区切りが気にならない場合は、これが最適な解決策になる可能性があります。

grep -w -v -f <(sed 's/[ \n\t]\+/\n/g' A) <(sed '$s/[ \n\t]\+/\n/g' B)

両方のファイルのデータがソートされている/同じ順序である場合は、使用することもできますcomm

comm -13 <(sed 's/[ \n\t]\+/\n/g' A) <(sed 's/[ \n\t]\+/\n/g' B)

score 1 · Accepted Answer

私があなたを正しく理解しているかどうかわからないので、この答えは暗闇の中で撮影されています.

最初に、各行に 1 つの単語を含むバージョンのファイルを作成します。次に、B をステップ実行します。

while read word; do …; done < B

B で見つかった単語ごとに、A から削除します (上の … で):

sed -i "s/^$word$//" A

たぶんそれが役立ちます。

linux - 2 つのテキスト ファイル間で同じ部分を見つける方法は?