PHP (および cURL) を使用して単純な Web クローラーを作成しました。これはおよそ 60,000 の html ページを解析し、製品情報を取得します (イントラネット上のツールです)。
私の主な関心事は、同時接続です。接続数を制限したいので、何が起こっても、クローラーは 15 を超える同時接続を決して使用しません。
IP による 25 の同時接続の制限に達すると、サーバーは IP をブロックします。何らかの理由で、サーバー側でそれを変更することはできないため、スクリプトが X を超える同時接続を使用しないようにする方法を見つける必要があります。 .
これは可能ですか?
それとも、全体を別の言語で書き直すべきでしょうか?
ありがとう、助けていただければ幸いです!