特定のドメインのすべてのページからすべての URL を取得する必要があります。バックグラウンド ジョブを使用し、クモの巣
を使用しようとする
複数のキューにそれらを配置するのは理にかなっていると思いますが、非常に紛らわしい宝石のようです。
anomone 、 anemone は長い間機能していますページ数が多い場合
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_every_page do |page|
puts page.links
end
end
何が私に一番合うと思いますか?