バッファーをパディングしてファジーハッシュの実装 (ssdeep/sdhash) に渡すことの意味は何ですか。
類似性をチェックしたいバッファが 2 つありましたが、それらは非常に短く、これらのツールは実行できません。
バッファ A: AAAAAAAAAAAAAAA バッファ B: AAAAAAA* B *AAAAAAA
ご覧のとおり、それらは非常に似ています。
両方を 0 でパディングすると (ページが整列):
バッファ A: AAAAAAAAAAAAAAA00000000000000....0000 (4096 バイトの「0」) バッファ B: AAAAAAA* B *AAAAAAA00000000000000....0000 (4096 バイトの「0」)
類似度スコアは 15 です。
それらをランダムデータでパディングしようとしたとき(もちろん、両方のバッファに同じランダムデータが追加されました)。類似性スコアは 86 です。
私が使用した両方のパディング手法の意味は何ですか? それらを使用する必要がありますか?