4

重複ファイル (つまり、同じデータを持つファイル) をチェックするための簡単なツールを作成しています。このメカニズムは、sha-512 アルゴリズムを使用して各ファイルのハッシュを生成し、これらのハッシュを MYSQL データベースに格納することです。ハッシュをbinary(64) unique not null列に保存します。各行には一意のバイナリ ハッシュがあり、ファイルが重複しているかどうかを確認するために使用されます。

-- 私の質問は --

  1. バイナリ列でインデックスを使用できますか? デフォルトのテーブル照合順序は latin1 - デフォルトの照合順序ですか?

  2. 高いパフォーマンスを得るには、Btree または Hash のどちらのインデックス作成メカニズムを使用する必要がありますか? 1 秒あたり 100 行を更新または追加する必要があります。

  3. 最高のパフォーマンスを得るには、他にどのようなことに注意すればよいですか?

4

1 に答える 1