1

現在、python とその urllib2、urllib を使用して、単純な静的 Web ページを取得しています。Web ページの開発者が Java スクリプトを追加するまでは、すべてがスムーズでした。最も興味深い情報がスクリプトの背後に隠されています。

<a href="javascript://" class="event-more-view" id="view-moreid-12311" onclick="Markets.applyView(this);return false;" treeid="1291266" eventstate ="false" > add table </a>

ブラウザはデータをプリロードし、「a href」リンクをクリックすると表示します。私の短い研究の結果は、JSOUP と HTMLunit です。私は正しい方向に掘っていますか?短所と長所はありますか?

パイソンは役に立ちますか?Java を使用する必要がありますか? 動的コンテンツに役立つパッケージは? 何が簡単ですか?

私の場合、組み込みスクリプトが時間の経過とともにデータを更新し、処理する必要がある限り、ある種の仮想ブラウザを作成する必要があります。

4

1 に答える 1

2

あなたは正しい方向に掘っています。

考慮すべきいくつかのオプション/ツールを次に示します。

以下も参照してください。

それが役立つことを願っています。

于 2013-07-02T11:53:19.450 に答える