web-crawler - 基本的なcrawler4jをフォーカスされたクローラーに変換します

翻译自：https://stackoverflow.com/questions/26772164 2014-11-06T05:12:13.693

235 次

シード URL からデータを取得し、ページをダウンロードできる基本的なクローラーを実装しました。さらに、指定された深さに達するまで、クローラーを同じシード Web サイトに保持できます。事前定義されたキーワードの最小しきい値を超えた場合にのみページがダウンロードされるように、クローラーにさらに制限を課すにはどうすればよいですか? shouldvisit() 関数にそのようなメソッドはありますか?

web-crawler - 基本的なcrawler4jをフォーカスされたクローラーに変換します

1 に答える 1

Related

Reference