私はScrapy
Webスクレイピングフレームワークをかなり広範囲に使用してきましたが、最近、 と呼ばれる別のフレームワーク/システムがあることを発見しました。pyspider
これは、githubページによると、新しく、活発に開発され、人気があります。
pyspider
のホームページには、すぐに使用できるいくつかの機能がリストされています。
スクリプト エディター、タスク モニター、プロジェクト マネージャー、結果ビューアーを備えた強力な WebUI
Javascriptページ対応!
タスクの優先度、再試行、定期的および再クロール (更新時間など) の年齢またはインデックス ページのマークによる
分散アーキテクチャ
これらはScrapy
それ自体では提供されないものですが、portia
(Web UI の場合)、scrapyjs
(js ページの場合)、scrapyd
(API を介したデプロイと配布) の助けを借りて可能になります。
pyspider
それだけでこれらすべてのツールを置き換えることができるというのは本当ですか? 言い換えれば、pyspider
Scrapy の直接的な代替手段はありますか? そうでない場合、それはどのユースケースをカバーしていますか?
「広すぎる」または「意見に基づく」一線を越えていないことを願っています。