0

ページの動的コンテンツと静的HTMLを読み込もうとしています。たとえば、http: //www.balsamiq.com/でHTMLをロードするだけでは、ページの下部にある大きな証言ボックスが表示されません。私は私が使用してhtmlをロードできることを知っています

html = open(url).read

ただし、この場合も、ページが読み込まれたときに表示される動的コンテンツが欠落します。人間がサイトを表示したときに取得するものと一致する完全なHTMLを取得するにはどうすればよいですか?ありがとう!

4

2 に答える 2

1

Mechanize ruby​​ gemを使用し、user_agentを設定することで、問題を解決しました。必ずしも私の質問に対する答えではありませんが、user_agentを検索ボットに設定すると、javascriptを含むページが動的でない形式で表示されました。

于 2012-06-12T18:15:50.577 に答える
0

watirもここであなたに役立つかもしれません。

于 2012-06-12T19:13:59.430 に答える