ファイルと文字列の両方でうまく機能することを確認した md5 関数があります。しかし、非常に大きなファイルの可変サイズのチャンクで使用すると、同じ md5 値が生成されますが、チャンクのサイズは異なります。
長さは異なるが内容が同じである可能性のある2つのチャンクが同様のmd5フィンガープリントになる可能性があるのだろうか。
ファイルと文字列の両方でうまく機能することを確認した md5 関数があります。しかし、非常に大きなファイルの可変サイズのチャンクで使用すると、同じ md5 値が生成されますが、チャンクのサイズは異なります。
長さは異なるが内容が同じである可能性のある2つのチャンクが同様のmd5フィンガープリントになる可能性があるのだろうか。
MD5 は 128 ビットのハッシュであるため、これが発生する確率は 1 / (2^128) です。これは 1/(3.4 x 10^38) を意味するため、可能性は低いですが、不可能ではありません。
あなたが何か間違ったことをしていて、実際には毎回同じテキスト/ファイルの MD5 を計算している可能性が高いと思います。
実行しようとしない限り、同じ MD5 ハッシュを取得する機会はありません。
コリジョンの詳細については、http ://www.mscs.dal.ca/~selinger/md5collision/ を参照してください。