0

LESS CSSを使用してサイトの開発を始めたとき、私は判断にある種のばかげた誤りを犯しました。LESSでは、URLの最後に#!watchを含めると、リアルタイムの更新を確認できます。それで、適切な怠惰な開発者である私は、自分の開発ページに、現在のURLに#!watchを追加することを知っているだけのボタンを作成しました。

ただし、Googleはそのhrefを正当なリンクとして扱っており、現在、すべてのページが2回インデックスに登録されています。1回は「通常の」ページ用で、もう1回はURLに#!watchが追加されています。

私の質問は、Googleのインデックスから!#watchを削除するにはどうすればよいですか?robot.txt行はそれを行うために機能しますか?それほど問題にはならないでしょうが、私は内部でもGoogleカスタム検索を使用しているので、ユーザーが私のサイト内を検索すると、同じコンテンツに対してあまりにも多くの結果が表示されます。

4

2 に答える 2

1

正規リンクメタタグを使用できます。これは、実際のページパスが何であるかを検索エンジンに通知するため、パスにハッシュタグまたはクエリ文字列が追加されている場合でも、インデックス作成を1回だけトリガーする必要があります。

http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

次のようになります:

<link rel="canonical" href="http://www.example.com/realPagePath/" />
于 2012-10-08T16:58:22.137 に答える
1

私がやろうとしていることは、それらの問題のあるリンクのそれぞれが期限切れになるように設定されたsitemap.xmlドキュメントを設定することです。各行(約18,000リンク)を反復処理し、フォーマットされたxmlを吐き出す短いPythonスクリプトを作成しました。次のようになります。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://oq.totaleclips.com/mpa/The_Rise_of_the_Guardians_The_Video_Game_(Game)#!watch</loc>      
        <expires>2012-10-08</expires>
    </url>
   ....... (many more url entries)
</urlset>

<expires>インデックス作成の締め切り日として、他の検索エンジンではないにしても、Googleによって読み取られるタグに注意してください。どうやら30〜60日間は表示された後、検索結果として返されることはなくなります。

于 2012-10-11T17:23:12.590 に答える