python - Web ページの特定のフレームを取得してそのコンテンツを取得する方法

翻译自：https://stackoverflow.com/questions/15785920 2013-04-03T11:20:20.130

10359 次

以下のURLの翻訳結果にアクセスしたかった

http://translate.google.com/translate?hl=en&sl=en&tl=ar&u=http%3A%2F%2Fwww.saltycrane.com%2Fblog%2F2008%2F10%2Fhow-escape-percent-encode-url-python% 2F

翻訳は、2 つのフレームのうち、下部のコンテンツフレームに表示されます。翻訳を取得するために下部のコンテンツフレームのみを取得することに関心があります。

Selenium for python を使用すると、Web オートメーションを介してページコンテンツをフェッチできます。

browser.get('http://translate.google.com/#en/ar/'+hurl)

必要なフレームは iframe です:

<div id="contentframe" style="top:160px"><iframe   src="/translate_p?hl=en&am... name=c frameborder="0" style="height:100%;width:100%;position:absolute;top:0px;bottom:0px;"></div></iframe>

しかし、ウェブ自動化を使用して翻訳を取得するために下部のコンテンツフレーム要素を取得する方法は?

PyQuery を使用すると、JQuery 形式を使用してコンテンツを参照することもできることがわかりました

アップデート：

答えは、Selenium がそれを行う方法を提供すると述べました。

frame = browser.find_element_by_tag_name('iframe')
browser.switch_to_frame(frame)
# get page source
browser.page_source

しかし、上記の例では機能しません。空のページを返します。

python - Web ページの特定のフレームを取得してそのコンテンツを取得する方法

2 に答える 2

Related

Reference