3

Mechanize を使用して多数の Web ページをクロールしていますが、メタ タグの取得に問題があります。

<meta property="og:longitude" content="-74.0100365">
<meta property="og:latitude" content="40.7199929">

og:longitudeパラメータとパラメータを取得したいog:latitude。おそらくページが動的に読み込まれるか何かが原因で、私が試したことが機能しません。これは私が現在使用しているコードです:

a = Mechanize.new { |agent|
  agent.user_agent_alias = 'Mac Safari'
}

a.get(some_web_page) do |page|
  puts page.search("latitude").first.text
  puts page.search("longitude").first.text
end
4

1 に答える 1

6

それはそのようになります:

page.at('meta[property="og:longitude"]')[:content]
page.at('meta[property="og:latitude"]')[:content]

:contentテキストではなく、必要なコンテンツ属性であるため、注意してください。

于 2012-09-25T00:24:38.830 に答える