たくさんの JavaScript を使って Web ページをスクレイピングしようとしています。pguardiano の助けを借りて、このコードを Ruby で作成しました。
require 'rubygems'
require 'watir-webdriver'
require 'csv'
@browser = Watir::Browser.new
@browser.goto 'http://www.oddsportal.com/matches/soccer/'
CSV.open('out.csv', 'w') do |out|
@browser.trs(:class => /deactivate/).each do |tr|
out << tr.tds.map(&:text)
end
end
スクレイピングは、約 1 時間のスリープ時間でバックグラウンドで再帰的に行われます。ルビー、特に Web スクレイピングの経験がないので、いくつか質問があります。
CPU と RAM の消費量が多い新しい Firefox セッションが開かれるたびに、それを回避するにはどうすればよいですか?
GUI を使用せずに Firefox エンジンを使用することは可能ですか?