3

java-api を使用して CSV からデータを取り込んでいます。各ドキュメントの主キーを維持する必要があります。

マークロジックは、挿入中に一意の自動生成 ID を提供しますか?

marklogic が提供しない場合、ランダムに生成された hexString 番号が 1 つ考えられますが、問題は、CSV に取り込むレコードが多数ある場合、この乱数が繰り返される可能性があることです。

このユースケースの進め方を教えてください。

4

2 に答える 2

3

推奨されるアプローチは、ランダムに生成された ID 値を使用することです。この ID 値は、データ セットのサイズに対して衝突の可能性が実用的でない十分な長さです。あなたは人間なので、衝突をチェックしたくなるでしょうが、数学はそれが単に無駄であると言います. 64 ビットのランダム値を使用している場合、40 億以降の衝突確率は 50/50 です。リスクが高すぎる?それが気になる場合は、128 ビットのランダム値を使用してください。「 64 ビット ハッシュ コードの衝突の確率」を参照してください。

于 2016-06-20T15:01:43.897 に答える