Nokogiri を使用して、次のようなサイトをスクレイピングしています。
<div class="BOX">
<div class="apple">This is an apple.</div>
<p>Apple a day, doctor away</p>
</div>
<div class="BOX">
<div class="iphone">This is an iPhone.</div>
<div class="android">This is an Android.</div>
<a href="www.apple.com">Apple home page</a>
<p>Snoop Lion has both. He's rich.</p>
</div>
「BOX」div内のすべてをスクレイピングしたいと思います。各「BOX」には独自の div と HTML タグがあり、明らかなパターンはありません。どうすればいいですか?
私の最初の試みは次のようになりました:
require 'uri-open'
require 'nokogiri'
doc = Nokogiri::HTML(open('http://www.examplesite.com'))
doc.css('BOX').each do |box|
puts box.content
end
しかし、それは何も返しません。何が起こっているのか説明をお願いできますか?