以前にフィードアグリゲーターを作成しましたが、少し最適化しようとしています。以前は、simplepie(phpクラス)を使用してフィードを解析し、各フィード項目に対してget_id()関数を使用して、ハッシュ(リンクとタイトルのmd5ミックス)を返していました。この「id」を「remote_id」としてMySQLに保存します。ただし、重複がないことを確認するために、フィードアイテムごとにSELECTクエリを実行して、「remote_id」が存在しないことを確認しています。何千ものフィードを見ていることを考えると、これは非効率のようです。
remote_idを一意のキーに変換してから、データベースが各パスで新しいレコードの書き込みに失敗するようにするのが最も効率的ですか?これを設計する他の方法は他にありますか?