問題タブ [noindex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
robots.txt - robots.txt: ボットが特定の「URL の深さ」にアクセスすることを許可しない
私はこの構造とのリンクを持っています:
- http://www.example.com/tags/何とか
- http://www.example.com/tags/blubb _
- http://www.example.com/tags/ blah / blubb (両方のタグに一致するすべてのアイテム)
URL に 1 つのタグが含まれるすべてのリンクを Google & Co にスパイダーしてもらいたいのですが、2 つ以上のタグが含まれる URL にはスパイダーを送信しないでください。
現在、問題を解決するために、html メタタグ「robots」->「noindex、nofollow」を使用しています。
robots.txt ソリューション (少なくとも一部の検索ボットでは機能します) はありますか?それとも、「noindex、nofollow」を続行して追加のトラフィックに対応する必要がありますか?
seo - Google のインデックスに登録されたページに関する SEO ヘルプ
Google の検索エンジン用にサイトを最適化する作業を行っていますが、最近、"site:www.joemajewski.com" クエリを実行すると、まったくインデックスに登録されるべきではないページの結果が得られることに気付きました。
たとえば、このページを見てみましょう: http://www.joemajewski.com/wow/profile.php?id=3
私は独自の CMS を作成しました。これは、ユーザー ID #3 の統計情報の内訳です。Google によってインデックス化されていることに気付きましたが、そうすべきではありません。Google の結果がサイトのコンテンツに正確に反映されるまでに時間がかかることは承知していますが、これは 6 か月近く不適切にインデックス登録されています。
私が取った予防策は次のとおりです。
私のrobots.txt
ファイルには次のような行があります:
Google ウェブマスター ツールを使用して URL を実行すると、disallow コマンドを実際に正しく作成したことが示されます。ただし、クロールされていないページがリンクされている場合は、検索結果に表示される可能性があると述べています. ということで、もう一つ対策を練りました。
ソース コードには、次のメタ データを含めました。
follow
これは、PageRank などを計算するときにページを使用することを意味し、検索結果にそのページを表示しないnoindex
ように Google に指示することを想定しています。
このページ profile.php は、$_GET['id'] を取得し、対応する登録ユーザーを見つけるために使用されます。そのユーザーに関する情報が少し表示されますが、検索結果に表示するほどの関連性はありません。そのため、Google によるインデックス登録を停止しようとしています。
Google がインデックスに登録している、削除してほしいページはこれだけではありません。私も WordPress ブログを持っていますが、削除したいカテゴリ ページ、タグ ページ、およびアーカイブ ページが多数あり、それらを削除するために同じ手順を実行しています。
Google の検索結果からページを削除する方法と、インデックスに登録したくないページの種類を判断するのに役立ついくつかの基準を誰かが説明できますか? 私の WordPress ブログに関して言えば、私が本当にインデックスに登録したい唯一のページは私の記事です。Googleからの運がほとんどなく、ブロックしようとした他のすべて。
WordPressのタグやカテゴリのページなど、新しいコンテンツや関連するコンテンツを提供しないページをインデックスに登録するのが悪い理由を誰かが説明できますか.
ありがとう!
php - noindex no follow variable-私はこれを正しく行いましたか?
すべてのページの先頭にこのスクリプトがあります。これには次のものが含まれます。
ヘッドがロードされた後、残りのページがロードされ、変数が設定されます。
$robots="オフ"; または $robots="";
Google でインデックスに登録する単一のページを取得できません。これが実際に壊れていて、すべてのページが noindex、nofollow に設定されているのではないかと思っています。ソースを表示すると、すべて問題ないように見えます。たとえば、インデックスを作成したいページには index、follow があり、不要なページには noindex、nofollow があります。
誰でも助けることができますか?
indexing - Googleがサイト/コンテンツのインデックスを作成しないようにする方法
私の手には、グーグル(またはそのことについてはyahoo / bing)が特定のコンテンツをインデックスに登録しないことを非常に確信している必要がある場合があります。したがって、冗長性が高いほど良いです。
私が知る限り、それを達成するための3つの方法がありますが、もっとあるのではないかと思います(ここでは冗長性が重要です):
- メタタグをインデックスなしに設定します
- robots.txtで影響を受けるURL構造を禁止する
- ajaxを介してコンテンツをポストロードします
ですから、それがすべての方法であるなら、それは良いことですが、誰かがさらに確実にする方法について何らかのアイデアを持っているなら、それはただのダンディでしょう:D
(私はそれが少し狂っているのを知っています、しかしコンテンツがどういうわけかグーグルに現れるならば、それは私の会社にとって本当に高価になるでしょう:'-()
ruby-on-rails - Rails-リダイレクトアクションの検索エンジンインデックス作成
私は、各ページの記事のタイトルを組み込んだ説明的なseo urlを使用して、異なる言語で同じコンテンツを使用する多言語サイトを持っています。翻訳された記事の上記の言語を切り替えるために、前の言語を使用して翻訳されたタイトルを検索し、それにリダイレクトするアクションがあります。ビューがないにもかかわらず、グーグルが上記のリダイレクトURLをインデックスに登録していることに気付いた場合を除いて、これはすべて正常に機能します。
これは悪い習慣ですか?すべてのページに301リダイレクトへのリンクがあるように見えるので、301リダイレクトは本当に悪い考えです。どういうわけかメタタグを含めるのですか、それとも他のアプローチがありますか?
私が現在これを持っている理由は、各記事ページが各ページの上部にあるフラグを使用してそのすべての翻訳にリンクすることを望んでいるからです。考えれば考えるほど、直接URLを生成する必要があります。これ自体がseoのメリットをもたらす可能性があるからです。私がこの道をたどらなかった理由は、もともとページのレンダリング速度でした。複数の記事でURLスラッグを検索し、タイトルが変更されるとすべての言語のキャッシュを期限切れにする必要があります(これはwikiスタイルのユーザー生成コンテンツです)。また、翻訳が存在しない場合もあります。その場合は、代わりに、たとえば、フラッシュメッセージのある記事のカテゴリにリンクする必要があります。
それで、執筆中にこれを熟考することは、解決策を実装するのがより難しい場合、おそらくこれが好ましいように思われますか?
wordpress - ポップアップコメントのnoindex
WordPressブログでポップアップコメントを使用しています。ほとんどの人がこれを推奨していないことは知っていますが、私の聴衆はこのようにコメントを本当に気に入っています。
しかし最近、Googleが一時的なポップアップコメントページのインデックスを作成して、404エラーを大量に生成していることを発見しました。
Googleにポップアップページを無視させるにはどうすればよいですか?これらのページにnoindex、nofollow、noarchiveを追加できますか?コメントリンクをクリックすると自動的に生成されます。
私のページ:http://www.sedentario.org/
noindex - Web サイトの 1 ページを Google でインデックスに登録しない方法
Web サイトの 1 ページが Google や他のロボットによってインデックスに登録されないようにする方法に興味があります。私のスクリプトには、TPL ファイル、Index.tpl、Header.tpl を含むテンプレートがあります。
ありがとうございました
web-crawler - NOINDEXメタタグを使用してページを保存できますか?
私はwebcreawlerを実行していて、robots.txtとmetatagsNOINDEX
およびをフォローしようとしていますNOFOLLOW
。
NOFOLLOW
ページ内のリンクをたどらないようにと私に言いますが、NOINDEX
?
検索でページのインデックスを作成しないことは理解していますが、検索は行わず、ページをデータベースに保存するだけです。
NOINDEX
データベースに保存する場合、またはこれが検索にのみ適用される場合、タグを軽視しますか?
robots.txt - noindex は robots.txt で有効ですか?
noindex は robots.txt ファイルのオプションのディレクティブですか、それともオプションは user-agent、disallow、allow、crawl-delay だけですか?
たとえば、これは robots.txt ファイルの内容に対して有効ですか?