ruby - 情報を複製せずに複数のファイルをマージする最良の方法

Question

Nウイルス対策のスキャン結果を含むさまざまなテキストファイルが与えられた場合N、重複するさまざまなテキストファイルに共通する行を除いて、これらのファイルをマージする最善の方法、つまり最も最適化された方法を知りたいです。だから私は2つの結論に達しました:

各行が最終的なテキストファイルに既に存在するかどうかを確認し、存在する場合は書き込みません。
すべてをコピーして重複行を削除

他の解決策があるかもしれませんが、私にはわかりません。これを考えると、どのように進めるのが最善でしょうか?

score 0 · Accepted Answer

配列を追加してから、.uniqおそらくそれらに追加できますか？

1.9.3-p429 :001 > a = ['test', 'test2'] + ['test2', 'test3']
[
    [0] "test",
    [1] "test2",
    [2] "test2",
    [3] "test3"
]
1.9.3-p429 :002 > a.uniq
[
    [0] "test",
    [1] "test2",
    [2] "test3"
]

もちろん、これは行が完全に同一であることに依存します。

ruby - 情報を複製せずに複数のファイルをマージする最良の方法

1 に答える 1

Related

Reference