PHP/CURL (または別のテクノロジー) を利用して Web サイトからコンテンツをダウンロードするための最良の方法について、誰かが推奨する方法があるかどうか知りたいです。現在、curl_multi を使用して一度に 10 個のリクエストを処理しています。
文字通り、毎日約 10 万ページをリクエストする必要がありますが、これは少し面倒です (現在は 16 時間かかります)。私の最初の考えは、複数の仮想マシンをセットアップしてタスクを分割することだけですが、並列化以外に欠けているものがあるのではないかと考えていました。(いつでも問題にもっと多くのマシンを投入できることは知っています)
前もって感謝します!