2

Mechanizeライブラリを使用してWebサイト上のすべてのリンクを検索するにはどうすればよいですか?

Webサイトのすべてのリンクを取得するために、内部リンクを再帰的に解析したいと思います。

4

2 に答える 2

5

アネモネの宝石を見たことがありますか?スパイダー Web サイト用に特別に作成されました。

Web サイトのすべてのリンクを取得して印刷するには、次のようにします。

require 'anemone'

Anemone.crawl("http://www.example.com/") do |anemone|
  anemone.focus_crawl { |page| puts page.links }
end

サイド全体をスパイダーするか、特定のタイプのリンクを除外するか、または何かのようなリンクを除外するかを選択するオプションがかなり詳しく文書化されています.

于 2012-07-23T14:55:03.357 に答える