base_result.htm
pyquery でhtml ファイルを開くと、 が返さ[None]
れ、検索するとエラーがスローされます。その同じファイルを文字列として使用すると、すべてがうまく機能します。
>>> d = PyQuery(filename = 'base_result.html')
>>> d
[None]
>>> f = open('base_result.html')
>>> d = PyQuery(f.read())
>>> d
[<html>]
base_result.htm
pyquery でhtml ファイルを開くと、 が返さ[None]
れ、検索するとエラーがスローされます。その同じファイルを文字列として使用すると、すべてがうまく機能します。
>>> d = PyQuery(filename = 'base_result.html')
>>> d
[None]
>>> f = open('base_result.html')
>>> d = PyQuery(f.read())
>>> d
[<html>]
PyQuery の未解決の問題: https://github.com/gawel/pyquery/issues/22
上記のリンクには、次のようないくつかの回避策が記載されています。
>>> from lxml.html import parse
>>> parse("index.html")
<lxml.etree._ElementTree object at 0x108a72f38>
>>> pq(parse("index.html").getroot())
また
>>> f = open('index.html')
>>> d = PyQuery(f.read())