Mac OS X 10.6.8 の Python 2.7.3 で次のコードを実行しています。
import StringIO
from lxml import etree
f = open('./foo', 'r')
doc = ""
while 1:
line = f.readline()
doc += line
if line == "":
break
tree = etree.parse(StringIO.StringIO(doc), etree.HTMLParser())
r = tree.xpath('//foo')
for i in r:
for j in i.iter():
print j.tag, j.text
そして、ファイル foo には
<foo> AAA <bar> BBB </bar> XXX </foo>
出力は
foo AAA
bar BBB
テキストが表示されないのはなぜXXX
ですか? どうすればアクセスできますか?
ありがとう