0

パームビーチ郡保安官事務所の警察のブロッターから逮捕データを取得しようとしています。

私は検索をウェストパームビーチの街に限定し、データまでさかのぼります(1974年10月31日)。

私はFireFoxを使用しています。

結果が表示されたら、FireBugを開き、[HTML]タブを確認すると、ページから必要な情報(つまり、逮捕された人の名前、逮捕された住所、料金など)を確認できます。

Net >> XHR >> PostタブをチェックしてPOSTリクエストパラメータを見つけ、それをコードに入れましたが、返されるHTMLには探している重要な情報が含まれていません。

私が間違っているのか、それともサイトがスクレイプできないのか、誰か知っていますか?これが私のコードです:

require 'rubygems'
require 'nokogiri'
require 'restclient'
require 'open-uri'

blotterURL = 'http://www.pbso.org/index.cfm?fa=blotter'

city = "west palm beach"
fromrec = 1

if page = RestClient.post(blotterURL, {'city_name'=>city, 'fromrec'=>fromrec})
    puts Nokogiri::HTML(page)
end
4

1 に答える 1

1

これは、ページが ajax の更新によって取り込まれているためです。おそらく、watir-webdriver が最適なオプションです。

于 2012-06-19T00:17:17.077 に答える