0

Nウイルス対策のスキャン結果を含むさまざまなテキスト ファイルが与えられた場合N、重複するさまざまなテキスト ファイルに共通する行を除いて、これらのファイルをマージする最善の方法、つまり最も最適化された方法を知りたいです。だから私は2つの結論に達しました:

  • 各行が最終的なテキスト ファイルに既に存在するかどうかを確認し、存在する場合は書き込みません。
  • すべてをコピーして重複行を削除

他の解決策があるかもしれませんが、私にはわかりません。これを考えると、どのように進めるのが最善でしょうか?

4

1 に答える 1

0

配列を追加してから、.uniqおそらくそれらに追加できますか?

1.9.3-p429 :001 > a = ['test', 'test2'] + ['test2', 'test3']
[
    [0] "test",
    [1] "test2",
    [2] "test2",
    [3] "test3"
]
1.9.3-p429 :002 > a.uniq
[
    [0] "test",
    [1] "test2",
    [2] "test3"
]

もちろん、これは行が完全に同一であることに依存します。

于 2013-07-08T15:54:49.267 に答える