私はしばらく Nutch 2.x で遊んでいます。Nutch 2.x のチュートリアルに従って、この投稿でアドバイスされているようにセットアップしましたが、まだわかりません。どんな助けも大歓迎です。
チュートリアルに従って INJECT コマンドを使用すると、seeds.txt にある 2 つの URL が挿入されます。
nutch inject ../local/urls/seed.txt
ただし、スクリプトを実行すると、どの URL にもアクセスしません。
bin/crawl ../local/urls/seed.txt TestCrawl *ttp://l*calhost:8983/solr 2