0

私のアプリケーションでは、URL コンテンツをデータベースの特定のテーブルに保存します。重複を最小限に抑えるために、各コンテンツのチェックサムを計算したいと考えています。チェックサムを保存するのに最適なsqlserverデータ型は何ですか? URLのコンテンツ(html)のチェックサムを計算する最速の方法は?

4

2 に答える 2

3

SHA1を使用してチェックサムを計算できます。結果は、16 進文字列または SQL の blob フィールドとして格納できるバイト配列ですが、実用的な理由から、文字列の方が便利だと思います。

于 2010-09-11T15:13:13.363 に答える
2

SQL Server の組み込み関数を使用して、これらのいずれかを計算できます (MD2、MD4、MD5、SHA、または SHA1)。

SELECT HashBytes('MD5', 'http://www.cnn.com')

varbinary データ型 0xC50252F4F24784B5D368926DF781EDE9 を返します

SELECT CONVERT(VARCHAR(32),HashBytes('MD5', 'http://www.cnn.com'),2)

varchar C50252F4F24784B5D368926DF781EDE9 を返す

あとは、varchar または varbinary が必要かどうかを選択し、それを列に使用するだけです

HashBytes を使用した MD2、MD4、MD5、SHA、または SHA1 ハッシュの生成を参照してください。

于 2010-09-11T15:27:11.523 に答える