Google 検索アプライアンスがこの情報にアクセスできることは知っていますが (これは PageRank アルゴリズムに影響するため)、クローラ アプライアンスからこの情報をエクスポートする方法はありますか?
コンテンツの大部分が企業イントラネット用であるため、外部ツールは機能しません。
Google 検索アプライアンスがこの情報にアクセスできることは知っていますが (これは PageRank アルゴリズムに影響するため)、クローラ アプライアンスからこの情報をエクスポートする方法はありますか?
コンテンツの大部分が企業イントラネット用であるため、外部ツールは機能しません。
Googleで入手できるものかもしれませんが、チェックしたことはありません。私は通常、W3C が提供するリンク チェッカーを使用します。W3C はリダイレクトを検出することもできます。これは、サーバーが 404 ステータス コードを返す代わりにリダイレクトすることで 404 を処理する場合に役立ちます。
Google ウェブマスター ツールを使用して、特にサイト上の壊れたリンクを表示できます。
ただし、これにより、外部サイトへの壊れたリンクは表示されません。
Xenu と呼ばれる無料のツールが、このタスクに最適な武器であることが判明しました。 http://home.snafu.de/tilman/xenulink.html#Download
Webサーバーのログを分析して、404ページすべてを探してみませんか?それははるかに理にかなっており、はるかに信頼性があります。