3

私が持っている 2 つの別々のファームでクロールを機能させようとしていますが、どちらでも機能させることができません。どちらも 2 つの WFE を持ち、追加の WFE がインデックス サーバーとして構成されています。クエリ専用のサーバーがもう 1 台と、データベース用にクラスター化された SQL 2005 バックエンド サーバーが 2 台あります。検索エンジンのソリューションで見つけた少なくとも 50 の異なる Web サイトを試してみましたが、うまくいきませんでした。http://servername:12345をデフォルト ゾーンとして使用し、http: //abc.companyname.comをカスタム ゾーンおよびイントラネット ゾーンとして使用するように Web アプリを構成 (拡張)しました。それぞれをコンテンツ ソースに入力してクロールを実行しようとすると、クロール ログにいくつかのエラーが記録されます。

http://servername:12345
は 、「サーバーに接続できませんでした。サイトにアクセスできることを確認してください。」を返します。

http://abc.companyname.comの戻り値:
「Gatherer によって削除されました。(このアイテムを含む開始アドレスまたはコンテンツ ソースが削除されたため、このアイテムも削除されました。)」

ただし、両方の URL をクリックでき、ページにアクセスできます。

何か案は?


より詳しい情報:

いわばスレートを一掃し、別のクロールを実行して更新されたサンプルを提供しました。

私のコンテンツソースは次のとおりです。

http://servername:33333
http://sharepoint.portal.fake.com
sps3://servername:33333

現在のクロール ログ エラーは次のとおりです。

sps3://servername:33333
PortalCrawl Web サービスでエラーが発生しました。

http://servername:33333/mysites
この URL のコンテンツは、インデックス属性がないため、サーバーによって除外されます。

http://servername:33333/mysites
クロール

sts3://servername:33333/contentdbid={62a647a...
クロール済み

sts3://servername:33333
クロール済み

http://servername:33333
クロール済み

http://sharepoint.portal.fake.com
クローラーがサーバーと通信できませんでした。サーバーが使用可能であること、およびファイアウォール アクセスが正しく構成されていることを確認してください。

上記のタイプミスを再確認しましたが、何も表示されないため、これは正確な反映であるはずです.

4

6 に答える 6

4

覚えておくべきことの1つは、SharePointサイトのクロールは、ファイル共有やSharePoint以外のWebサイトのクロールとは異なるということです。

他のいくつかのクイックポインタ:

  • sps3:プロトコルは、PeopleSearchのユーザープロファイルをクロールするためのものです。ユーザープロファイルの準備ができるまで、クローラーがそれについて言ったことはすべて無視できます。
  • クロールアカウントは、ファーム全体にアクセスできるはずです。アクセス許可エラーが表示された場合は、クロールアカウントをリセットする方法を説明しているKB記事を見つけてください(これは特定のstsadm.exeコマンドです)。別のファームのコンテンツをクロールしようとしている場合は、クロールアカウントへのアクセスを許可するために別の方法を実行する必要があります。これが現在の最大の問題だと思います。
  • クローラー(インデックスサーバーから実行)は、パブリックURLにアクセスしようとします。以前にサーバー間の通信の問題が発生しました。3つのサーバーすべてが相互にpingできることを確認し、インデックスサーバーがパブリックURLに到達できることを確認します(インデックスサーバーでIEを開き、チェックアウトします)。問題がある場合は、インデックスサーバーのhostsファイルをダーティアップするときが来ました。これはとにかくSharePointが行うことなので、それほど悪くはありません。統合Windows認証以外のものを設定した場合は、クローラーを機能させるためにさらに努力する必要があります。

とにかく、応答にはたくさんの行き来があったので、私はそこにたくさんの提案をショットガンしているだけです、多分それらの1つは目標に向かっています。

于 2008-10-06T13:05:29.847 に答える
1

あなたの問題のほとんどはKerberosに関連しているようです。インフラストラクチャの更新が適用されていない場合、Sharepointは、デフォルト以外(80/443)のポートを使用するWebサイトに対してKerberos認証を使用できません。また、サーバー4にある場合はサーバー5からCAにアクセスできないのもそのためです(おそらく)。SPNが正しく設定されていない場合、CAはインストールされているマシンからのみアクセスできます。デフォルトのURLとしてポート80を使用してSharepointをインストールした場合は、問題なくローカルのSharePointクロールを実行できます。ただし、設計上、ローカルSharePointサイトのクロールは、既定のURLを使用してSharePointサイトにアクセスします。Kerberosと取得方法の詳細については、 http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6! 363.entryを確認してください。

于 2009-01-19T16:35:52.650 に答える
1

http://www.cnn.comのコンテンツ ソースを作成し、フル クロールを開始できますか? 同じエラーが発生しますか?

また、これをオフラインにする場合もあります。ご希望の場合はお知らせください。

ただし、stackoverflow を介してプライベート メッセージを送信する方法があるかどうかはわかりません。

于 2008-10-03T17:54:52.013 に答える
1

ファームのトポロジーについて少し混乱しています。単なる WFE としてインストールされたマシンをインデクサーにすることはできません。「完全」としてインストールされたマシンは、インデクサー、クエリ、および/または wfe...

また、既定のコンテンツ アクセス アカウントを変更する代わりに、代わりにクロール ルールを追加することもできます (すべてが稼働状態になったら)。

インデクサーの %commonprogramfiles%/microsoft shared/web server extensions/12/logs に役立つ情報があるかどうかを確認できますか?

ログ ファイルは少し冗長な場合があります。"started" または "full" を検索すると、通常、ログ内でクロールが開始された行にたどり着きます。

また、SQL マシンでは、MSScrawlurlhistory テーブルから詳細情報を取得できる場合があります。

于 2008-10-02T18:43:32.023 に答える
0

[サーバーのサービス] セクションで、検索クロール アカウントのプロパティをチェックして、設定されていること、およびそれらのサイトにアクセスする権限があることを確認します。

于 2008-09-22T03:59:23.130 に答える
0

新しい入力をありがとう!

だから私は週末から戻ってきて、あなたの指針を調べてすべてを試してから、それらがどのように機能しなかったかを報告し、得られた結果を投稿したいと思いました. しかし、面白いことが起こりました。

インデクサー (servername5) に移動し、Internet Explorer から Central Admin とメイン ポータルに接続しようとしました。どちらも機能しませんでした。そこで、インデクサーで IIS にアクセスし、IIS 内からメイン ポータルを参照しようとしました。それも機能せず、他の何かがそのポートを使用していることを示すエラーを受け取りました。そのため、以前のビルドの古い Web サイトを見て、対応するアプリケーション プールと共に IIS から削除しました。次に、新しいビルドから Web サイトのアプリケーション プールを開始し、Web サイトを参照しました。成功。次に、自分の PC のブラウザーから Web サイトを閲覧しました。再び成功。次に、次のように、サーバー名ではなく完全な URL でクロールを実行しました。

http://sharepoint.portal.fake.com

再び成功。サブサイトを含むポータル全体を思い通りにクロールしました。「インデックス内のアイテム」はすぐに読み込まれ、進行中であることがわかりました。

servername5 から servername4 でホストされている Central Admin サイトにまだアクセスできません。理由はわかりませんが、現時点ではそれほど重要なことはわかりません。

これは私をどこに置きますか?何が修正されましたか?

まだわかりません。再構築だったのかもしれません。サーバー ファームを再構築するとすぐに、サーバー ファームを機能させるために必要なものはすべて揃っていたのかもしれませんが、以前の Web サイトがまだ IIS にあるために機能しませんでした。(SharePoint のアンインストールがいかにずさんなものであるかというのは面白い話です。コンテンツ データベース、Web サイト、およびアプリケーション プールを手動で削除する必要があるように思われますが、おそらくそうすべきではありません。)

いずれにせよ、現在は「テスト」ファームで動作しているため、本番ファームで動作させることが重要です。この経験の後、それがそれほど難しくないことを願っています。

みんなからの助けに感謝します!

于 2008-10-08T07:48:34.823 に答える