1

私は自分のWebページでsimple_html_domを使用して、3つの別々のページを保存し、それらのページ内のさまざまなものを検索して印刷しています。これにより、ページの読み込みにかなりの時間がかかります。

simple_html_domを最適化してより高速に実行できる方法はありますか?それとも、速度を上げるために一緒に使用する必要があるものは他にありますか?3ページはそれほど多くないと思いますが、おそらく私は間違っています。一度に3つの別々のページをロードするようなものだと思いますが、それでは、処理を高速化するために使用できるものはありますか?

前もって感謝します!

4

1 に答える 1

2

おそらく、検索対象、つまりパーサーをスクレイピングするDOMの量によって異なります。最近、simple_html_domを使用して、ほぼ1,000ページからすべてを1回のリクエストで抽出しましたが、すべてを処理するのに10秒ほどかかりました。

HTTPリクエストにほとんどの時間がかかる可能性があります。ページをフェッチしてスクレイプするwgetか、またはお好みの方法を試してから、ローカルハードディスクに保存されているファイルに対してsimple_html_domを実行してください。

于 2013-02-18T17:58:35.937 に答える