ローカル モードで Ubuntu のバックグラウンド プロセスとして Nutch クロールを実行すると、Fetcher がハング スレッドで中断します。メッセージは次のようなものです。
WARN fetcher.Fetcher - 「X」ハング スレッドで中止します。
セッションからログオフし、クローラーをサーバー上で引き続き実行したいので、nohup と & を使用してスクリプトを開始します。そうしないと、クロールが特定の深さで終了し、crawldb が更新されているときに、SSH セッションがタイムアウトになります。「キープアライブ」メッセージを設定しようとしましたが、あまり助けがありませんでした。コマンドは次のようなものです。
nohup ./bin/nutch crawl ....... &
誰もこれを経験したことがありますか?nohup または & を使用した場合にのみ発生するようです。