私はPythonウェブスクレイピングに取り組んでいます
Webページはiframeを使用して汚染されており、コンテンツはajax(jquery)で埋められています
iframeのsrcを使用してみました(lxmlを使用)が、役に立たない
Pythonモジュールを使用してiframeのコンテンツを抽出するにはどうすればよいですか?
ありがとう
私はPythonウェブスクレイピングに取り組んでいます
Webページはiframeを使用して汚染されており、コンテンツはajax(jquery)で埋められています
iframeのsrcを使用してみました(lxmlを使用)が、役に立たない
Pythonモジュールを使用してiframeのコンテンツを抽出するにはどうすればよいですか?
ありがとう
Selenium がその仕事をしてくれます。http://seleniumhq.org/docs/03_webdriver.htmlを見てください。
Splinter (http://splinter.cobrateam.info - セレンを使用) を使用すると、iframe 要素を簡単に参照できます。少なくとも iframe タグに id 属性がある限り。