各ファイルに 1 列のデータ (各ファイルに約 2000 行) が含まれる 4 つのテキスト ファイルがあります。私がやろうとしているのは、すべてのファイルを比較し、異なるファイル間の重複を判断することです。したがって、file1 には何が含まれているが他の 3 つのファイルには含まれていないか、file2 には何が含まれているが他の 3 つのファイルには含まれていないか、file1 と file2 のみに何が含まれているかなどを知りたいと思います。最終的な目標は、ベン図を作成することですファイル間のさまざまな重複を示す 4 つの重複する円。
私はこれを行う方法を理解しようとして頭をかき集めてきました。私は comm と diff コマンドで遊んでいますが、すべてのファイルでこれを行うのに問題があります。これを行う方法について何か提案はありますか?
助けや提案をありがとう。