0

Nutch 2.1 の使用

最初のクロール中に、クロールするページ数を制限するためにいくつかの URL を除外しました。これらの拒否ルールを regex-urlfilter.txt から削除してこれらのコマンドを実行すると、フィルタリングされた URL が取得されません。

bin/nutch updatedb
bin/nutch generate
bin/nutch fetch -all

私は何が欠けていますか?

4

1 に答える 1

1

Nutch ユーザー グループに関するこの投稿は、それを行うのに役立つかもしれません。

于 2013-05-30T01:25:08.703 に答える