0

PHP cURL の経験は豊富ですが、Python Scrapy を使用して Web サイトのデータをスクレイピングすることに夢中になっています。データをスクレイピングし、戻り値と速度とメモリ使用量を操作するのにどちらが優れているかわかりません。

また、Python Scrapy の (yield) 関数は何をすべきなのでしょうか?

4

1 に答える 1

3

Scrapy はフレームワークです。URL をクロールするパイプラインと体系的な方法を定義できます。cURL は、HTTP などのプロトコルを介してページをクエリしたり、ファイルをダウンロードしたりするための単純なボイラー プレート コードです。

大規模なスクレイピング システムまたはプロジェクトを構築している場合は、おそらく Scrapy の方が適しています。それ以外の場合は、ハッキーまたは 1 回限りのものの場合、cURL に勝るものはありません (または、PHP に制約されている場合)。

于 2013-05-20T22:23:30.327 に答える