java - 生成された HTML を含む HTML ページをロードする

Question

今日、Google は失敗しているようです。リモートの HTML ページを Java アプリケーションにロードする方法を探しています。この HTML ページには、ほとんどのコンテンツを生成する JavaScript が含まれています。ここで、Java でページを開いて HTML を確認するのはかなり簡単だと思いました。

URL.openStream() を使用してファイルを読み取ると、生成された HTML を使用せずに JavaScript を使用して HTML ソースを取得します (これは私が期待することです)。では、これから生成されたコンテンツを含む HTML ソースを取得するにはどうすればよいでしょうか? 私はそれがかなり簡単だと思っていましたが、Googleで数時間後、Rhino、EnvJs、Jsoupに完全に巻き込まれましたが、実際にはどこにも行きません.

誰か提案はありますか？

score 2 · Accepted Answer

はい、基本的に簡単な解決策はありません。実際にページをレンダリングする必要があるため、javascriptエンジンが必要です（feeelaが言うように）。

1つの解決策は、Webkitを使用することです。私はJavaでは使用していませんが、Pythonで使用しています。複数のプラットフォーム上のJavaアプリでWebKitブラウザーを見ることができます

java - 生成された HTML を含む HTML ページをロードする

1 に答える 1

Related

Reference