ESE データベースに数百万のデータ レコードを追加する必要があります。他の値の中でも、各レコードには一意の文字列値があります。この値はキーと考えることができます。
レコードにとって興味深いのは、入力セット内に同じレコードの同一のインスタンスが複数存在する可能性があることです。入力したら、一意の文字列のそれぞれを持つ 1 つのレコードのみが必要です。
私の質問は、これを行う方法です-重複をすばやく除外するにはどうすればよいですか?
現在、キーの検索を行った後にのみ各レコードを追加しています。エントリが既に存在する場合はスキップします。データベースにない場合は、レコードを追加して進行します。ここでの大きなコストは、各エントリで検索を行うことです。
これを非常に高速にするためのアイデアはありますか?重複の追加が失敗するように値をキー設定する方法はありますか?