Searcharoo.NET を使用して、特定の言語の Web サイト "testsite.com/en" をクロールしています。「testsite.com/fr」「testsite.com/us」などがあります。後で、各サイトのページにインデックスを付けて検索できるようにしたいのですが、異なる言語を分離したいと考えています。
問題は、searcharoo が testsite.com/en でクロールを開始すると、testsite.com/fr などの他の言語のページもインデックスに登録することです。これを防ぐ方法はありますか?クローラーを前方のみに検索するか、特定のページで停止するように制限できると思いましたが、searcharoo からこの件に関するドキュメントは見つかりませんでした。
ありがとうございます!