さまざまなウェブサイトからコンサートデータを取得しようとしています。私はいくつかのスクリプトを作成しました。各スクリプトは特定のWebサイトからデータを取得し、予測可能な構造を持つハッシュに編成します。これらの各スクリプトには、scrape
これを実現する機能があります。これらのスクレーパースクリプトはすべてディレクトリにあります。次に、ディレクトリ内のスクリプトごとに、そのスクリプトを呼び出してscrape
データベースにデータを追加するマスタースクリプトを作成します。
このマスタースクリプトをResqueワーカーにして、サイトが毎日バックグラウンドで各サイトをスクレイプするようにする予定です。
マスタースクリプトでこれを達成するにはどうすればよいですか?今、私は次のようにディレクトリを調べます。
Dir.glob(/app/workers/scraped_venues/*.rb) do |venue_scraper|
# call that script's `scrape` function
# use data from that `scrape` call
end