ページをクロールし、ページの要素を配列に格納しました。
最初の要素を調べると:
puts "The inspection of the first my_listing: "
puts my_listing.first.first.inspect
出力は次のとおりです。
The inspection of the first my_listing:
#<Nokogiri::XML::Element:0x80c58764 name="p" children=[#<Nokogiri::XML::Text:0x80c584e4 " May 4 - ">, #<Nokogiri::XML::Element:0x80c58494 name="a" attributes=[#<Nokogiri::XML::Attr:0x80c58340 name="href" value="http://auburn.craigslist.org/web/2996976345.html">] children=[#<Nokogiri::XML::Text:0x80c57f08 "residual income No experience is needed!!!">]>, #<Nokogiri::XML::Text:0x80c57da0 " - ">, #<Nokogiri::XML::Element:0x80c57d50 name="font" attributes=[#<Nokogiri::XML::Attr:0x80c57bfc name="size" value="-1">] children=[#<Nokogiri::XML::Text:0x80c577c4 " (online)">]>, #<Nokogiri::XML::Text:0x80c5765c " ">, #<Nokogiri::XML::Element:0x80c5760c name="span" attributes=[#<Nokogiri::XML::Attr:0x80c574b8 name="class" value="p">] children=[#<Nokogiri::XML::Text:0x80c57080 " img">]>]>
各要素にアクセスするにはどうすればよいですか? たとえばText
、このオブジェクトの最初の要素である 'May 4 -' にアクセスするにはどうすればよいでしょうか?
私が行った場合:
puts my_listing.first.first.text,
私はこの出力を得る:
May 4 - residual income No experience is needed!!! - (online) img
href
また、属性にアクセスするにはどうすればよいですか?
my_listing.first.first[:href]
これは機能しません。