特定のサイトをクロールする予定です。数か月に1回クロールしたい3000の特定のページがあります。クローラーを作成しましたが、サイトから禁止されたくありません。
クローラーの攻撃性を軽減したり、何らかの方法でクローラーを非表示にして、クロールしているプロバイダー/ Webサイトに「気づかれない」、または問題を引き起こさないようにする方法はありますか?
遅延は可能ですが、ページごとにランダムに10〜30秒の遅延に設定すると、永久に時間がかかります。
許容できるクローラーを作成するためのヒントやガイドラインはありますか?