ウィキペディアのページから俳優のフィルモグラフィをスクレイプする関数を作成しようとしています。これはコードの例です
doca = Nokogiri::HTML(open("http://en.wikipedia.org/wiki/Kevin_Bacon"))
grandparent = doca.xpath('//div[@id="mw-content-text"]').children()
child = []
grandparent.each {|node|
node.children.each{|x|
if x['id'] == "Films"
child = node.next_element.children
break
end
}
}
子配列の各要素には、フィルモグラフィテーブルの1行が含まれるようになりました。私が本当に望んでいるのは、各映画のhrefリンクを配列に保存することですが、それぞれの映画の中にうまくネストされているため、それらにアクセスするのに問題があります。どんな助けでも大歓迎