gb2312 でエンコードされた Web ( http://bbs.nju.edu.cn/ )とやり取りするために Python でスプリンターを使用しようとしています。しかし、要素を見つけるのに問題があります。BOM edcoding なしの UTF-8 で notepad++ を使用しています。以下に示すように、私は多くの調査を行い、エンコード/デコードを練習しました。ただし、まだ機能していません。実行すると、「いいえ」を出力し続けます
#coding=utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
from splinter.browser import Browser
url = "http://bbs.nju.edu.cn/"
browser = Browser(driver_name = "chrome")
browser.visit(url)
str = u"新手求助"
if browser.is_text_present(str.decode("utf-8").encode("gb2312")):
print "Yes"
else:
print "No"