作業中のRubyスクリプトでWebページをスクレイプしようとしています。プロジェクトの目的は、どのETFと株式投資信託がバリュー投資哲学と最も互換性があるかを示すことです。
スクレイプしたいページの例は次のとおりです。
http://finance.yahoo.com/q/pr?s=SPY+Profile
http://finance.yahoo.com/q/hl?s=SPY+Holdings
http://www.marketwatch.com/tools/mutual-fund/list/V
Rubyに推奨するWebスクレイピングツールとその理由を教えてください。そこには何千もの株式ファンドがあることを覚えておいてください、それで私が使うどんなツールも適度に速くなければなりません。
私はRubyを初めて使用しますが、lxmlを使用してPythonでWebページをスクレイプした経験があります(https://github.com/jhsu802701/dopplervalueinvesting/blob/master/screen.py)。5000以上の株のページがダウンロードされると、lxmlはわずか数分でそれらすべてをスクレイプできます。(BeautifulSoupを試したのを覚えていますが、遅すぎたため拒否しました。)