私が持っている 2 つの別々のファームでクロールを機能させようとしていますが、どちらでも機能させることができません。どちらも 2 つの WFE を持ち、追加の WFE がインデックス サーバーとして構成されています。クエリ専用のサーバーがもう 1 台と、データベース用にクラスター化された SQL 2005 バックエンド サーバーが 2 台あります。検索エンジンのソリューションで見つけた少なくとも 50 の異なる Web サイトを試してみましたが、うまくいきませんでした。http://servername:12345をデフォルト ゾーンとして使用し、http: //abc.companyname.comをカスタム ゾーンおよびイントラネット ゾーンとして使用するように Web アプリを構成 (拡張)しました。それぞれをコンテンツ ソースに入力してクロールを実行しようとすると、クロール ログにいくつかのエラーが記録されます。
http://servername:12345
は
、「サーバーに接続できませんでした。サイトにアクセスできることを確認してください。」を返します。
http://abc.companyname.comの戻り値:
「Gatherer によって削除されました。(このアイテムを含む開始アドレスまたはコンテンツ ソースが削除されたため、このアイテムも削除されました。)」
ただし、両方の URL をクリックでき、ページにアクセスできます。
何か案は?
より詳しい情報:
いわばスレートを一掃し、別のクロールを実行して更新されたサンプルを提供しました。
私のコンテンツソースは次のとおりです。
http://servername:33333
http://sharepoint.portal.fake.com
sps3://servername:33333
現在のクロール ログ エラーは次のとおりです。
sps3://servername:33333
PortalCrawl Web サービスでエラーが発生しました。
http://servername:33333/mysites
この URL のコンテンツは、インデックス属性がないため、サーバーによって除外されます。
http://servername:33333/mysites
クロール
sts3://servername:33333/contentdbid={62a647a...
クロール済み
sts3://servername:33333
クロール済み
http://servername:33333
クロール済み
http://sharepoint.portal.fake.com
クローラーがサーバーと通信できませんでした。サーバーが使用可能であること、およびファイアウォール アクセスが正しく構成されていることを確認してください。
上記のタイプミスを再確認しましたが、何も表示されないため、これは正確な反映であるはずです.