HASH
非常に単純な質問: BigQuery の機能の背後に隠されている CityHash のバージョンはどれですか? それは常に最新 (現在は v1.1) ですか、それとも修正されたバージョンですか?
さて、背景を少し。大量のデータセットを保存するために、BigQuery に大きく依存する予定です。これらのデータから、初めて、ハッシュ値を計算して保存したいと思います(のようなものhashed_value = HASH(CONCAT(column_0, column_1))
)。ここまでは順調ですね。2 回目は、 などのリクエストで特定のハッシュ値を持つ行を取得したいと考えていますSELECT something FROM [mytable] WHERE hashed_value = HASH(CONCAT('12345', 'foobar'))
。ここでの私の懸念は、CityHash の Web ページで、これらの関数が下位互換性を持たないと指定されていることです。そのため、BigQuery が常に最新バージョンの CityHash に依存している場合、次回の CityHash の更新後に一部の計算列のハッシュ値に基づいてデータを取得できなくなります。そして、私のアプリケーションでは、大規模なデータベースは本質的に役に立たなくなります。
もしそうなら、それに加えて、固定された(または下位互換性のある)ハッシュ関数へのアクセスを与えることは可能でしょうHASH
か? SHA
たとえば、CityHashMD
の固定バージョンなどです。
ありがとうございました。