すべての画像ファイルを保存するリポジトリがあります。重複している画像がたくさんあることを知り、重複した画像を1つずつ削除したいと考えています。
各画像ファイルのチェックサムを生成し、ファイルの名前をそのチェックサムに変更すると、ファイル名を調べることで重複したファイルがあるかどうかを簡単に見つけることができると思いました。しかし、問題は、使用するチェックサム アルゴリズムの選択について確信が持てないことです。たとえば、MD5 を使用してチェックサムを生成する場合、ファイルがまったく同じであることを意味するチェックサムが同じであるかどうかを正確に信頼できますか?