python - XML の解析時にすべての nodeValue フィールドが None である

Question

Python で単純な Web ベースの RSS リーダーを作成していますが、XML の解析に問題があります。Pythonコマンドラインでいくつかのことを試すことから始めました。

>>> from xml.dom import minidom
>>> import urllib2 
>>> url ='http://www.digg.com/rss/index.xml'
>>> xmldoc = minidom.parse(urllib2.urlopen(url))
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> titlenode = channelnode[0].getElementsByTagName("title")
>>> print titlenode[0]
<DOM Element: title at 0xb37440> 
>>> print titlenode[0].nodeValue 
None

私はしばらくこれをいじりましたが、nodeValueすべてのはのようNoneです。しかし、XML を見ると、そこには間違いなく値があります。私は何を間違っていますか？

score 17 · Accepted Answer

RSS フィードについては、Universal Feed Parserライブラリを試す必要があります。RSS フィードの処理が大幅に簡素化されます。

import feedparser
d = feedparser.parse('http://www.digg.com/rss/index.xml')
title = d.channel.title

score 10 · Accepted Answer

これはあなたが探している構文です：

>>> print titlenode[0].firstChild.nodeValue
digg.com: Stories / Popular

ノード値はノード自体の論理的な子孫であることに注意してください。

python - XML の解析時にすべての nodeValue フィールドが None である

2 に答える 2

Related

Reference