2

現在、PostgreSQL データベースにインポートしている大規模な地理空間データ セット (〜 30m レコード) があります。各レコードに一意の ID を割り当てる必要がありますが、データ セットを再インポートする必要が生じた場合に確実に再作成できないため、増分する整数はお勧めできません。

決定された射影におけるジオメトリ データの一意のハッシュは、信頼できる識別子の最良のオプションであると思われます。Postgres 内でハッシュを計算できることは有益であり、速度も有益です。

この状況を考えると、私の選択肢は何ですか?この状況に非常に適した特定の方法はありますか?

4

1 に答える 1

2

データに依存する (そしてデータから再作成できる) 一意の識別子が必要な場合、最も簡単なオプションはMD5ハッシュのようです。これは Posgresql に含まれており (追加のライブラリは必要ありません)、非常に効率的であり、このためにシナリオ - 安全。

pgcrypto モジュールは、SHA1 などの追加のハッシュ アルゴリズムを提供します。

もちろん、ハッシュされるデータが一意であることをアサートする必要があります。

于 2013-04-11T14:58:43.067 に答える