多くの文字列データ (csv ファイル) の比較に問題があります。これらのファイルには uniqueID がありますが、ソートされておらず、非常に大きいです。
そこで、キーがファイルの uniqueID で、値が int で、変更に関心のある文字列の GetHashCode() を返す 2 つの辞書を作成しようとしました。
しかし、短い例:
if ("30000100153:135933:Wuchterlova:335:2:Praha:16000".GetHashCode() ==
"30000263338:158364:Radošovická:1323:10:Praha:10000".GetHashCode())
{
Console.WriteLine("Hmm that's strange");
}
それを行う方法は他にありますか?
フットプリントをできるだけ小さくする必要があります (約 3M 行を含む 2 つの csv ファイルの 2 つの辞書のメモリ割り当てのため) ありがとうございます