0

多数のRSSフィードからMySQLデータベース(実際のフィードのタイトルとリンクのみ)に記事を収集しています。フィードを再確認するときに、同じ記事を2回入力しないようにしたいと思います。テーブルには最大200,000のエントリを格納する予定です。

重複をチェックするための最良の方法はどれですか。

  1. URLをDB内の一意のフィールドにします。
  2. すべての記事に新しい一意の識別子を作成します(SHA1のURLやタイトルなど)。
  3. 他に何かありますか?

編集:#1を確認してくれてありがとう。

4

2 に答える 2

2

UNIQUEキーはこのために設計されています。

一括挿入したいが重複エラーがある可能性がある場合は、INSERT IGNORE

于 2012-10-08T19:02:57.273 に答える
1

3つのオプションのうち、余分な作業を行わずに実行可能なのは1つだけです

オプション2と3はすべて、さらに多くのことを行う必要がありますUNIQUEINSERTSに固執します。

于 2012-10-08T19:03:57.977 に答える