sharepoint-2010 - Dokuwiki ページでの FAST Search for Sharepoint Crawler の問題

Question

私のフラストレーションのレベルは、Dokuwiki サイトをクロールすることで最大になっています。

Dokuwiki/doku.php サイトをクロールするように設定した SharePoint の FAST 検索を使用するコンテンツソースがあります。私のクローラールールは次のように設定されています: http://servername/ * 、大文字と小文字を区別し、複雑な URL をクロールするこのパス内のすべてのアイテムを含めます。クロールルールでコンテンツソースをテストすると、クローラーによってクロールされることが示されます。ただし..... クロールは常に 2 分未満で終了し、指定したページのみをクロールして完了し、そのページには他のリンクはありません。Dokuwki 管理者に確認したところ、ロボットのテキストを許可するように設定されています。ページのソースを見ると、 meta name="robots" content="index,follow" と書かれていることがわかります

他のリンクされたページに問題がないことをテストするために、これらのリンクを手動でコンテンツソースに追加し、再クロールしました。例のソースページには 3 つのリンクがあります。

サイトA
サイト B
サイトC。

サイト A、B、C の URL をクロールソースに追加しました。このクロールの結果は 4 回成功し、プライマリソースページと他のリンク A、B、および C が手動で追加されました。

私の質問は、クローラーがページ上のリンクをクロールしないのはなぜですか? これは私の側のクローラーで行う必要があることですか、それとも名前空間の定義方法と Dokuwiki でのリンクの作成方法と関係があることですか?

どんな助けでもいただければ幸いです

エリック

score 0 · Accepted Answer

FAST Crawl Logsでの認証であることを示唆する問題は報告されていませんが、問題は認証に関するものでした。修正は、検索インデックスサーバーのIPアドレスに$ freepass設定を追加して、Appacheがページヒットごとに認証プロセスを実行しないようにすることでした。

返信いただきありがとうございます

エリック

score 0 · Accepted Answer

遅延インデックス作成オプションと rel=nofollow オプションを無効にしましたか?

sharepoint-2010 - Dokuwiki ページでの FAST Search for Sharepoint Crawler の問題

私のフラストレーションのレベルは、Dokuwiki サイトをクロールすることで最大になっています。

2 に答える 2

Related

Reference