ruby - Mechanizeを使用して、Webサイトのすべてのリンクを取得します

Question

Mechanizeライブラリを使用してWebサイト上のすべてのリンクを検索するにはどうすればよいですか？

Webサイトのすべてのリンクを取得するために、内部リンクを再帰的に解析したいと思います。

score 5 · Accepted Answer

アネモネの宝石を見たことがありますか？スパイダー Web サイト用に特別に作成されました。

Web サイトのすべてのリンクを取得して印刷するには、次のようにします。

require 'anemone'

Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.focus_crawl { |page| puts page.links }
end

サイド全体をスパイダーするか、特定のタイプのリンクを除外するか、または何かのようなリンクを除外するかを選択するオプションがかなり詳しく文書化されています.

2 に答える 2