17

Selenium 2 ライブラリを使用して 2 日目ですが、Unicode の痛みは治まらないようです。

私は最も基本的な操作を行っているだけで、ページのソースを印刷したい:

from selenium import webdriver


driver = webdriver.Firefox()
driver.get("http://google.com")

print driver.page_source

案の定、エラーが発生します。

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045:  
ordinal not in range(128)

これを にエンコードするにはどうすればよいutf-8ですか?

4

2 に答える 2

28

この同様の質問に基づいて、オプションがあります。

ソースをすべてのASCIIに変換して、プロセスでUnicode文字を失うことができます。

(driver.page_source).encode('ascii', 'ignore')

または、これを好むと思いますが、次のように utf-8 にエンコードできます (driver.page_source).encode('utf-8')

于 2013-05-29T20:31:11.700 に答える