Google CSE(Custom Search Engine)有料サービスを使用して、Webサイトのコンテンツのインデックスを作成しています。このサイトは、ほとんどがインクルードファイルでアセンブルされたPHPページで構成されていますが、データベースから単一のページテンプレートに情報をプルする動的ページがいくつかあります(たとえば、新しいリリース)。私たちが抱えている問題は、データベース内のコンテンツに有効期限を設定できるため、「id=2」と言うと「このコンテンツは期限切れです」という通知が表示されることです。ただし、ID 2にアップロードされたPDFが添付されている場合、PDFファイルは検索インデックスに残ります。
クリーンアップスクリプトを記述してcronに実行させ、データベースを調べ、期限切れのコンテンツを見つけ、アップロードされたファイルが添付されているかどうかを確認し、名前を変更するか削除することができますが、より良い解決策が必要です(私は願っています)。
過去にこれに遭遇したことがあるかどうか、そしてあなたが提案することを私に知らせてください。
ありがとう。