shell - シェルスクリプトを使用して 2 つのリストを比較する

Question

ファイル f1、f2 に 2 つの数値リストがあり、それぞれの数値が 1 行に 1 つずつあるとします。最初のリストで 2 番目のリストにない数と、その逆の数を確認したい。現在、grep -f f2 -v f1 を使用してから、シェルスクリプトを使用してこれを繰り返しています。これはかなり遅いです (二次時間が痛い)。これを行うより良い方法はありますか？

score 8 · Accepted Answer

こういうのは「comm」が好きです。(ファイルはソートする必要があります。)

$ cat f1
1
2
3
$ cat f2
1
4
5
$ comm f1 f2
        1
2
3
    4
    5
$ comm -12 f1 f2
1
$ comm -23 f1 f2
2
3
$ comm -13 f1 f2
4
5
$

score 2 · Accepted Answer

それぞれの数字を 1 行にまとめてdiff(1) 入れていただけないでしょうか? 適切に機能させるためには、事前にリストをソートする必要があるかもしれません。

score 1 · Accepted Answer

1 つのファイルが他のファイルのサブセットである特殊なケースでは、次のようになります。

cat f1 f2 | sort | uniq -u

大きなファイルの行のみをリストします。そしてもちろん、にパイプするwc -lとカウントが表示されます。

しかし、それはまさにあなたが説明したものではありません。

このワンライナーは私の特定のニーズに頻繁に対応しますが、より一般的な解決策を見たいと思っています。

shell - シェル スクリプトを使用して 2 つのリストを比較する

3 に答える 3

Related

Reference

shell - シェルスクリプトを使用して 2 つのリストを比較する