Webページ全体(全体)のソースコードを取得したいのですが、Webサイトの一部のコンテンツが最初にロードされません。(これはAjaxと関係があるようです)Javaで一度にロードされないこれらのコンテンツを取得するにはどうすればよいですか?
使ってみましたjava's url.openStrem
。しかし、これはうまくいきませんでした。loading...
ロード後に実際のコンテンツではなく、コンテンツ " " しか取得できませんでした。
どうもありがとうございました。
そのようなことにはhtmlパーサーを使用してみてください。ここではJericho Htmlparserが役に立ちます。
既存のブラウザをリモート コントロールする必要があります (Java ではほとんどが他の言語/コンポーネント システム/インターフェイスを使用するため、これは簡単ではありません)、または Javascript を実行できるヘッドレス ブラウザを使用する必要があります。HTMLUnitは後者のカテゴリになります。