次の形式の 2 つのファイルがあります。
File1: - 4 つの列が含まれています。最初のフィールドはテキスト形式の ID で、残りの列もテキスト値です。
id1 val12 val13 val14
id2 val22 val23 val24
id3 val32 val33 val34
File2 - ファイル 2 には ID しかありません。
id1
id2
出力
id3 val32 val33 val34
私の質問は: ID (最初のフィールド) が 2 番目のファイルに表示されない最初のファイルから行を見つける方法です。両方のファイルのサイズはかなり大きく、file1 には 4,200 万行、サイズは 8GB、file2 には 3,300 万の ID が含まれています。2 つのファイルの ID の順序が同じでない場合があります。