-1

Nokogiri を使い始めて、IMDB からいくつかのデータを抽出しようとしています。ただし、IMDB の html は少しおかしくて、作成者の名前など、いくつかの CSS セレクターを見つけることができないようです: http://www.imdb.com/title/tt1439629/。どうすれば私が求めているものを手に入れることができますか?

require 'nokogiri'
require 'open-uri'

url = "http://www.imdb.com/title/tt1439629/"
doc = Nokogiri::HTML(open(url))  
puts doc.at_css("h1").text.strip
4

2 に答える 2

1

これは Nokogiri の初心者向けチュートリアルで、firebug とそのコピー CSS 機能を使用して、探しているものを非常に簡単に見つける方法を説明しています。

http://ruby.bastardsbook.com/chapters/html-parsing/

于 2012-10-18T07:44:16.450 に答える
0

これは機能します:

puts doc.at_css("div.txt-block a").text.strip
> Dan Harmon
于 2012-10-18T06:04:52.747 に答える