URL からいくつかの画像 (BufferedImage として) をダウンロードし、それを画像プロセッサに渡す画像処理コードを実行しています。
同じ画像を画像プロセッサに複数回渡すことを避けたい (画像処理操作は高コストであるため)。画像の URL エンドポイント (同じ画像の場合) は異なる場合があるため、URL によってこれを防ぐことができます。そのため、チェックサムまたはハッシュを実行して、コードが同じ画像に再び遭遇しているかどうかを特定することを計画していました.
md5の場合、私はFast MD5を試しましたが、画像 (いくつかのサンプル) に対して 20K+ 文字の長さの 16 進チェックサム値が生成されました。この 20,000 文字以上のハッシュを格納することは、データベース ストレージに関しては明らかに問題になります。したがって、CRC32(java.util.zip.CRC32から)を試しました。そして、ハッシュよりもかなり短い長さのチェックサムを生成しました。
チェックサムとハッシュが異なる目的であることは理解しています。上記で説明した目的のために、CRC32 をそのまま使用できますか? それは目的を解決しますか、それともこれら2つ以上のことを試さなければなりませんか?
ありがとう、アビ