コンテンツが 15 日間サイトに残り、その後削除されるサイトを作成します。
私は SEO についてあまり詳しくありませんが、私の懸念は、検索エンジンによって「コンテンツ」がインデックス化されることによる SEO への影響であり、ある日突然、404 のままになります。
可能な限り最も SEO に適した方法で出入りするコンテンツに対処するために私ができる最善のことは何ですか?
コンテンツが 15 日間サイトに残り、その後削除されるサイトを作成します。
私は SEO についてあまり詳しくありませんが、私の懸念は、検索エンジンによって「コンテンツ」がインデックス化されることによる SEO への影響であり、ある日突然、404 のままになります。
可能な限り最も SEO に適した方法で出入りするコンテンツに対処するために私ができる最善のことは何ですか?
最善の方法は、HTTP ステータス コード 410 で応答することです。
w3c から:
要求されたリソースはサーバーで使用できなくなり、転送先アドレスも不明です。この状態は永続的であると考えられています。リンク編集機能を持つクライアントは、ユーザーの承認後に Request-URI への参照を削除する必要があります。状態が永続的かどうかをサーバーが認識していない場合、または判断する機能がない場合は、代わりにステータス コード 404 (Not Found) を使用する必要があります。特に明記しない限り、この応答はキャッシュ可能です。
410 応答は、主に、リソースが意図的に利用できないこと、およびサーバーの所有者がそのリソースへのリモート リンクを削除することを望んでいることを受信者に通知することにより、Web メンテナンスのタスクを支援することを目的としています。このようなイベントは、期間限定の販売促進サービスや、サーバーのサイトでもはや働いていない個人に属するリソースによく見られます。永久に利用できないすべてのリソースを「なくなった」とマークしたり、マークを一定期間保持したりする必要はありません。これはサーバー所有者の裁量に任されています。
ステータスコードの詳細はこちら
トラフィックを維持するには、古いコンテンツを削除せずにアーカイブするオプションがあります。そのため、古い URL で引き続きアクセスできますが、サイトのアーカイブのより深いポイントでリンクされています。
本当に削除したい場合は、404 または 410 で戻っても問題ありません。Spider は、リソースがもう利用できないことを理解しています。
ほとんどの検索エンジンは、robot.txt ファイルと呼ばれるものを使用します。検索エンジンで無視する URL とパスを指定できます。したがって、すべてのコンテンツが www.domain.com/content/* にある場合、サイトのそのブランチ全体を Google に無視させることができます。