7

Python で単純な Web ベースの RSS リーダーを作成していますが、XML の解析に問題があります。Pythonコマンドラインでいくつかのことを試すことから始めました。

>>> from xml.dom import minidom
>>> import urllib2 
>>> url ='http://www.digg.com/rss/index.xml'
>>> xmldoc = minidom.parse(urllib2.urlopen(url))
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> titlenode = channelnode[0].getElementsByTagName("title")
>>> print titlenode[0]
<DOM Element: title at 0xb37440> 
>>> print titlenode[0].nodeValue 
None

私はしばらくこれをいじりましたが、nodeValueすべての は のようNoneです。しかし、XML を見ると、そこには間違いなく値があります。私は何を間違っていますか?

4

2 に答える 2

17

RSS フィードについては、Universal Feed Parserライブラリを試す必要があります。RSS フィードの処理が大幅に簡素化されます。

import feedparser
d = feedparser.parse('http://www.digg.com/rss/index.xml')
title = d.channel.title
于 2009-01-26T13:21:44.747 に答える
10

これはあなたが探している構文です:

>>> print titlenode[0].firstChild.nodeValue
digg.com: Stories / Popular

ノード値はノード自体の論理的な子孫であることに注意してください。

于 2009-01-26T13:26:05.767 に答える