ruby - Rubyスクリプトを使用して大きなファイルから数行を削除する

Question

File 1: 1356775 lines
File 2: 9516 lines

ファイル 2 には、ファイル 1 で一致した場合にそのファイルから削除する必要がある番号の行が含まれています。例：

ファイル 1

34234323432 some useless stuff
23423432342 more useless stuff
98989898329 foo bar blah
65367389473 one two three

ファイル 2

234234323
653673894

新しいファイル

34234323432 some useless stuff
98989898329 foo bar blah

今の私のアプローチは、

ただし、ファイルが非常に大きいため、file1 の各行に対して配列全体 (9516 要素) をループしているため、これを行うには膨大な時間がかかります。ファイルのレコードをDBテーブルに入れずに、このタイプのファイル操作を行う簡単な方法はありますか?

score 1 · Accepted Answer

数値をキー、「true」を値として、ハッシュで file2 を読み取ります。ハッシュは、ルックアップが高速になるように設計されています。配列よりもはるかに高速です。

score 0 · Accepted Answer

多くのブロッキング IO を回避して、File1 のチャンクをメモリに読み込むことができます。

2 に答える 2