1

今日、Google は失敗しているようです。リモートの HTML ページを Java アプリケーションにロードする方法を探しています。この HTML ページには、ほとんどのコンテンツを生成する JavaScript が含まれています。ここで、Java でページを開いて HTML を確認するのはかなり簡単だと思いました。

URL.openStream() を使用してファイルを読み取ると、生成された HTML を使用せずに JavaScript を使用して HTML ソースを取得します (これは私が期待することです)。では、これから生成されたコンテンツを含む HTML ソースを取得するにはどうすればよいでしょうか? 私はそれがかなり簡単だと思っていましたが、Googleで数時間後、Rhino、EnvJs、Jsoupに完全に巻き込まれましたが、実際にはどこにも行きません.

誰か提案はありますか?

4

1 に答える 1

2

はい、基本的に簡単な解決策はありません。実際にページをレンダリングする必要があるため、javascriptエンジンが必要です(feeelaが言うように)。

1つの解決策は、Webkitを使用することです。私はJavaでは使用していませんが、Pythonで使用しています。複数のプラットフォーム上のJavaアプリでWebKitブラウザーを見ることができます

于 2012-10-23T13:08:20.887 に答える