私は何千万もの Web ページをクロールするシステムを開発しています。クローラーをゼロから開発したくありません。
次の基準に適合するオープンソースの Web クローラーはどれですか。
- カスタマイズ可能
- スケーラビリティの高い
- ajax Web サイトを簡単にクロールします
- 賢く這う
- 礼儀を守る
見落としがある場合は、重要と思われる他の基準を評価してください。
次のオープンソース クローラーのリストがあります。上記の機能を備えていますか?
- スクレイピー
- 機械化する
- ナット
- ヘリトリックス
- 亜麻
- httrack
- クモ
- サーチャルー