1

私はPythonウェブスクレイピングに取り組んでいます

Webページはiframeを使用して汚染されており、コンテンツはajax(jquery)で埋められています

iframeのsrcを使用してみました(lxmlを使用)が、役に立たない

Pythonモジュールを使用してiframeのコンテンツを抽出するにはどうすればよいですか?

ありがとう

4

2 に答える 2

1

Selenium がその仕事をしてくれます。http://seleniumhq.org/docs/03_webdriver.htmlを見てください。

于 2012-05-18T12:02:51.623 に答える
1

Splinter (http://splinter.cobrateam.info - セレンを使用) を使用すると、iframe 要素を簡単に参照できます。少なくとも iframe タグに id 属性がある限り。

于 2012-05-19T08:23:54.750 に答える