2

だから私は URL を解析していて、Nokogiri を使用してページ内のすべてのリンクのリストを取得したいと考えています。

しかし、返された結果を 2 次元配列にプッシュしたいと考えています。

私は今これをやっています:

def my_list(url)
    root = Nokogiri::HTML(open(url))
    list = []

    root.css("a").each do |link|
        list << (link[:href])           
    end

end

これにより、http リンクのみが表示されます。そうすればlist << link、完全な<a>タグが表示されます。

私がしたいのは、リンクのテキスト (を使用できますlink.text)だけをプッシュしてlist[0][0]、href 値 (を使用link[:href]) を他のセルにプッシュすることlist[0][1]です。

それ、どうやったら出来るの?

ありがとう。

4

2 に答える 2

5
def my_list(url)
  root = Nokogiri::HTML(open(url))
  root.css("a").map do |link|
    [link.text, link[:href]]           
  end
end
于 2012-04-18T20:26:46.930 に答える
4
def my_list(url)
    root = Nokogiri::HTML(open(url))
    list = []

    root.css("a").each do |link|
        list << [link.text,link[:href]]           
    end

end
于 2012-04-18T20:26:52.840 に答える