0

ID列、日付列などで構成される100万件のレコードを含むcsvファイルがあります。入力ファイルから各レコードを読み取り、file1 nをリストに入れ、挿入中にその特定のIDがすでに存在するかどうかを確認する必要がありますはいの場合はリストで、日付をfile1の新しい日付に置き換えます。

これはバイナリ検索(List.BinarySearch)(C#)で実行できますが、ファイルサイズが大きいため、面倒なプロセスになると思います.代替手段は何ですか.これを効率的に行うにはどうすればよいですか

ありがとう

4

3 に答える 3

4

それらを に追加しますHashSet<T>

HashSet は効率的な検索を行い、必要に応じて重複を上書きします。アイテムの平等
を管理する必要があります。

于 2014-04-04T08:28:09.827 に答える
0

このリストをデータベース テーブルにインポートし、SQL クエリを介して前述のフィルタリングを実行することを検討しましたか? 私が見たところ、クエリはそれほど複雑ではない可能性があり、すべてのフィールドをグループ化して選択することmax(yourdate)は、確かに非常に良い出発点になるでしょう。しかし、データベースがこのタスクのオプションであるかどうかはわかりませんか?

于 2014-04-04T08:26:39.130 に答える