0

私が間違っていたことを見たかった。ここ。

別のドメインのリンクであっても、親ページにリンクを印刷する必要があります。そして出て行け。

require 'anemone'
url = ARGV[0]
Anemone.crawl(url, :depth_limit => 1) do |anemone|
    anemone.on_every_page do |page|
        page.links.each do |link|
            puts link
        end
     end
end

私は何を正しくやっていないのですか?

編集:何も出力しません。

4

1 に答える 1

0

これは私のために働いた

 require 'anemone'
    require 'optparse'
    file = ARGV[0]
    File.open(file).each do |url|
      url = URI.parse(URI.encode(url.strip))
      Anemone.crawl(url, :discard_page_bodies => true) do |anemone|
            anemone.on_every_page do |page|
                    links = page.doc.xpath("//a/@href")
                    if (links != nil)
                            links.each do |link|
                                    puts link.to_s
                            end
                    end
            end

      end
    end
于 2013-03-28T20:06:00.770 に答える