私は作成するつもりです:
- ID と一意のテキスト値を格納するためのテーブル (サイズが大きくなることが予想されます)
- 入力パラメーターとしてテキスト値を持つストアド プロシージャ (値が上記のテーブルに存在するかどうかを確認し、存在する場合は対応する ID を返し、存在しない場合は新しいレコードを挿入し、新しい ID も返します)
テキストのハッシュ値を使用してテキスト値の検索を最適化し、それにインデックスを作成したいと考えています。したがって、検索中は、クラスター化されていないインデックスが使用されることを期待しています (クラスター化されたインデックスではありません)。
HASHBYTESを使用することにしましたが、ハッシュ値をまたはSHA2_256
として保存している場合、違いや利点があるのではないかと思っています。BINARY(32)
NVARCHAR(16)