57

ページに移動し、Javascript を必要とするフォームにログインし、結果の Web ページを特定の条件に一致する結果を検索し、チェック ボックスをクリックし、クリックしてファイルをダウンロードします。これにはすべて Javascript が必要です。

ヘッドレス ブラウザが必要だと聞きました - 要件/設定は、Python から実行できること、できれば結果のスクリプトが py2exe でコンパイルできることです (私は他のユーザーのためにこのプログラムを書いています)。

これまでのところ、Windmill は私が望むもののように見えますが、よくわかりません。

どんなアイデアでも大歓迎です!

4

6 に答える 6

30

私は pyqt / pyside 経由で Python のヘッドレス ブラウザとして Webkit を使用します:
http://www.riverbankcomputing.co.uk/software/pyqt/download
http://developer.qt.nokia.com/wiki/Category:LanguageBindings:: PySide::ダウンロード

セットアップが簡単なため、特に webkit が気に入っています。Ubuntu の場合は、次を使用します。sudo apt-get install python-qt4

スクリプトの例を次に示します:
http://webscraping.com/blog/Scraping-JavaScript-webpages-with-webkit/

于 2011-05-17T04:11:15.010 に答える
11

この質問への答えはSpynnerでした

于 2011-11-09T18:21:25.483 に答える
9

私は、「シミュレートされた環境でクライアント側の JavaScript コードをテストするための軽量フレームワーク」である Zombie.js 用の Python ドライバーを作成している最中です。

私は現在、Node.js のバグの解決策で行き詰まっています (テストとコードをさらに作成する前に) が、進行中のプロジェクトを自由に監視してください。

https://github.com/ryanpetrello/python-zombie

于 2011-06-09T04:00:35.353 に答える
5

Javascript をサポートするヘッドレス ブラウザはまだそれほど多くありません。

Zombie.jsまたはPhantomjsを試すことができます。それらは Python ではなく、プレーンな Javascript であり、実際に機能します。

于 2011-05-28T00:57:28.783 に答える
3

Phantomjs を試してみてください。javascript のサポートが充実しています。次に、Pythonスクリプトのサブプロセスとして実行できます

http://docs.python.org/library/subprocess.html

それはそれをボスにすることができます。

于 2011-06-11T02:51:55.057 に答える
1

HTQLをIRobotSoftWebscraperと組み合わせて使用​​できます。例については、こちらを確認してください:http: //htql.net/

于 2011-05-28T00:51:20.580 に答える