1

http://support.xbox.com/en-us/contact-usは、javascriptを使用していくつかのリストを作成します。これらのリストのテキストを解析できるようにしたいと思います。したがって、上記のページでは、次のように返します。

Billing and Subscriptions
Xbox 360
Xbox LIVE
Kinect
Apps
Games

JavaScriptを使用して生成されていることに気付く前に、しばらくJSoupを使用しようとしていました。javascriptで生成されたコンテンツのページを解析する方法がわかりません。

どこから始めればいいですか?

4

3 に答える 3

1

いつでもページ全体をインポートしてから、ページで文字列区切り文字を実行し(returnなどを使用)、情報を含む文字列を探してから、必要な文字列を返し、その文字列から断片を引き出すことができます。それはそれを行うための汚い方法です、それを行うためのきれいな方法があるかどうかはわかりません。

于 2012-07-02T17:24:57.520 に答える
1

CobraのようなHTML+JavaScriptライブラリを使用することをお勧めします。HTML内のDOM要素を解析し、JavaScriptによって引き起こされたDOMの変更を適用します。

于 2012-07-02T17:26:40.497 に答える
0

テキストがjavascriptによって生成されるとは思わない...javascriptを無効にすると、これらのオプションはhtml内のこの場所にあります(javascriptを有効にせずにxpathを計算するよりも手書きの方が簡単だったという理由だけでjqueryセレクター:))

'div#ShellNavigationBar ul.NavigationElements li ul li a'

クエリへの直接の回答に関係なく、ドキュメントのスコープ内でjavascriptを評価する必要があります。これは、Javaではかなり複雑になると思います。関連するコンテンツを生成するjavascriptファイルを特定し、それを直接解析する方が幸運です。

于 2012-07-02T17:32:56.387 に答える