0

一部のサイトには、に関するURLパターンがありwww.___.com/id=1ますwww.___.com/id=1000。nutchを使用してサイトをクロールするにはどうすればよいですか。範囲内でフェッチするためのシードを提供する方法はありますか?

4

2 に答える 2

1

最も簡単な方法は、URLの初期リストを生成するスクリプトを用意することだと思います。

于 2010-06-14T13:39:37.253 に答える
0

番号。手動またはスクリプトを使用してそれらを注入しました

于 2014-03-18T17:54:32.897 に答える