Mechanize
ライブラリを使用してWebサイト上のすべてのリンクを検索するにはどうすればよいですか?
Webサイトのすべてのリンクを取得するために、内部リンクを再帰的に解析したいと思います。
Mechanize
ライブラリを使用してWebサイト上のすべてのリンクを検索するにはどうすればよいですか?
Webサイトのすべてのリンクを取得するために、内部リンクを再帰的に解析したいと思います。
アネモネの宝石を見たことがありますか?スパイダー Web サイト用に特別に作成されました。
Web サイトのすべてのリンクを取得して印刷するには、次のようにします。
require 'anemone'
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.focus_crawl { |page| puts page.links }
end
サイド全体をスパイダーするか、特定のタイプのリンクを除外するか、または何かのようなリンクを除外するかを選択するオプションがかなり詳しく文書化されています.