0

Web ブラウザの自動化に最適なフレームワーク/ライブラリを教えてください。タスクは、Web ブラウザーのページを開き、サインインし、長い検索を実行し、収集した情報を Excel に保存することです。現在、C# で IE 参照を使用していますが、職場では IE8 しか使用できませんでした。IE9 にアップグレードしたのに、ターゲット サイトの一部のスクリプトがエラーで動作し始めた場合。

私は awesomium を使用しようとしましたが、私が理解しているように、それを使用してページを解析できませんでした。これを高速で行うバリアントはありますか?ライブラリのサイズ - 関係ありません。

Scala と互換性のあるソリューションがあれば、それは素晴らしいことです。

4

1 に答える 1

0

om-nom-nom がすでに示唆しているように、最善の策はおそらくselenium webdriverのような webdriver 実装です。C# と Java のバインディングがあり、IE、FF、Chrome、phantomjs (ヘッドレスにしたい場合に最適) などを使用できます。

特にサイトのコンテンツが急速に変化している場合は、webdriver を使用して直接情報を収集することも最善の方法ではないことに注意してください。このような場合、html ページのソースを webdriver で保存してから、 JSoup などの静的コンテンツ用のより効率的なライブラリに切り替えると便利な場合があります

于 2013-05-07T11:19:09.877 に答える