私の Django アプリでは、selenium を使用してページを取得し、BeautifulSoup を使用して html を解析しています。Xvfb を使用して Debian で作業しています。これはコードです:
from selenium import webdriver
import os
os.environ["DISPLAY"]=":99"
driver = webdriver.Firefox()
driver.get("www.google.it")
text = driver.page_source
soup = BeautifulSoup(text)
(... some code to parse the page with ...)
非常に奇妙なエラーがあります。「スープ」で検索しても何も見つかりません。これは、ローカルの Windows XP マシンでは発生しません。「テキスト」にはhtmlがあります。
更新: おそらくコーデック/デコード エラーだと思いますが、この場合の処理方法がわかりません。