3

Beautifulsoup を使用して RSS/Podcast フィードを解析しようとしていますが、「pubDate」フィールドを解析できないように見えることを除けば、すべてうまく機能しています。

data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');

for item in items:
    title = item.find('title').string.strip()
    pubDate = item.find('pubDate').string.strip()

タイトルは正常に解析されますが、pubDate になると、次のように表示されます。

トレースバック (最新の呼び出しが最後): ファイル ""、2 行目、AttributeError: 'NoneType' オブジェクトに属性 'string' がありません

ただし、XML ファイルのコピーをダウンロードして「pubDate」の名前を別の名前に変更し、もう一度解析すると、うまくいくようです。pubDate は Python の予約変数ですか?

ありがとう、

g

4

1 に答える 1

3

で動作しitem.find('pubdate').string.strip()ます。フィードパーサーを使ってみませんか?

于 2010-01-30T16:26:12.083 に答える