HTMLスクレイピングを行い、APIを使用してデータを取得するスクレイパーを作成しました。これは非常に長いコードであるため、ここには記載していません。ランダム スリープ メソッドを実装し、それをコード内で使用してスロットルを監視しました。しかし、このコードをオーバーランしないようにしたいので、3 ~ 4 時間実行してから息抜きをしてから、もう一度実行するというのが私の考えです。私は検索しようとしていたPythonでこのようなことを何もしていませんが、どこから始めればよいかよくわかりません。これに関するガイダンスがあれば素晴らしいでしょう。Python に特定のモジュールへのリンクがある場合は、非常に役立ちます。
また、これは関連していますか?このレベルの複雑さは必要ありませんか?
Python の Cron のようなスケジューラの提案はありますか?
すべてのスクレイピング タスクに関数があり、それらすべての関数を呼び出す main メソッドがあります。