0

このコマンドをnutchで実行した後:

bin/nutch crawl urls -dir crawl -depth 3 -topN 5

私はURLのリストを取得します。50個のURLとだけ言いますが、すべてのURLを深さで区切ることは誰でも知っています。

だから私は結果を得るでしょう:

深さ1からのURL=5 url

  • url

  • url

  • url

.....。

深さ2からのURL=15 url

  • url

  • url

  • url

.....。

そのような何か、誰かがすでにこの問題を解決しましたか?

この問題を解決するための機能はありますか?

どんな助けでもありがたいです。

4

1 に答える 1

1

これを行うための組み込み関数は Nutch にありません。しかし、単純なハックは、dept 1 で nutch コマンドを実行し、Web テーブルをコピーしてから、deth 1 に対して再度実行することです。したがって、各ラウンドに対応する 2 つのバージョンの nutch Web テーブルがあります。

于 2012-10-18T08:00:25.770 に答える