ウェブサイト abc.com があり、以下のように abc.com の 100 ページをクロールするとします。
1 日目: maxDocumentsToDownload を 100 に指定して、heritrix でクロール ジョブを作成します。2 日目: 上記のジョブを heritrix で複製して実行します。
Web サイトが 2 日間変更されない場合、同じ 100 ページまたは別の 100 ページのセットになりますか?
さらに情報が必要な場合はお知らせください
ありがとう、ハリーシュ