いくつかの Java スクリプト タグを含む HTML ファイルがあります。このファイルを IE などのブラウザで実行すると、一部のコンテンツがソースからキャッシュされ、ブラウザに表示されます (たとえば、一部の都市の天気)。このファイルを実行して、html
以前に Web ブラウザーに表示されていた Web ページのコンテンツを取得するにはどうすればよいですか? アプリケーションにコンテンツを表示したくありません。返されたデータを解析し、いくつかの特別なコンテンツを抽出したい (たとえば、各都市の天気を抽出する)。誰でも私を案内してもらえますか?
質問する
349 次
2 に答える
1
あなたがやろうとしていることは、html スクレイピングと呼ばれます。
これは一般的で複雑な作業であるため、最良の選択肢は、ライブラリの形でヘルプを取得することです。
この質問を参照してください: HTML スクレイピングのオプション?
于 2012-04-04T07:28:14.673 に答える
0
セレンは良い賭けです。他のブラウザの中でも HtmlUnit、Firefox、Chrome をサポートしています。
于 2012-04-04T07:30:46.527 に答える