0

Searcharoo.NET を使用して、特定の言語の Web サイト "testsite.com/en" をクロールしています。「testsite.com/fr」「testsite.com/us」などがあります。後で、各サイトのページにインデックスを付けて検索できるようにしたいのですが、異なる言語を分離したいと考えています。

問題は、searcharoo が testsite.com/en でクロールを開始すると、testsite.com/fr などの他の言語のページもインデックスに登録することです。これを防ぐ方法はありますか?クローラーを前方のみに検索するか、特定のページで停止するように制限できると思いましたが、searcharoo からこの件に関するドキュメントは見つかりませんでした。

ありがとうございます!

4

1 に答える 1

1

男性が書いた次のブログを見てください。

 http://draganbl.blogspot.com/2011/04/how-do-you-use-searcharoo-library-to.html

思い通りにできるようには見えませんが、個々の言語ごとに「クローラー/スパイダー」をセットアップするかもしれません。私の答えはかなり漠然としていますが、おそらくそれはあなたを方向に導くことができます.

于 2013-03-20T06:27:58.417 に答える