クロールを開始すると、本来よりもはるかに時間がかかり、まだ完了していないことに気付きました
プロセス pid をチェックして、別の端末から何が起こっているかを確認しようとしましたが、出力は明確ではありませんでした。それらはすべて次の形式でした。
SEED、Prod、Cat 以外によって削除されました **** https://(クロールを希望するページの URL)
おそらく誰かがそれらを理解しているなら、私に知らせてくれるとうれしいです! 誰かがそれを処理する方法を知っていれば、それがクロール構成コード (crawl-beans.cxml) であるとは思えません。教えてください。