Pythonでユニバーサルフィードパーサーを使用して、Googleニュースからニュースのコーパスをダウンロードしようとしています(自然言語処理を行うため)。私は実際には XML について何も知りません。フィードパーサーの使用方法の例を使用しているだけです。問題は、RSS フィードから取得した dict でニュースの内容がタイトルだけで見つからないことです。
私が現在使用しようとしているコードは次のとおりです。
import feedparser
url = 'http://news.google.com.br/news?pz=1&cf=all&ned=us&hl=en&output=rss'
# just some GNews feed - I'll use a specific search later
feed = feedparser.parse(url)
for post in feed.entries:
print post.title
print post.keys()
この投稿で得られるキーは、タイトル、概要、日付などだけです。コンテンツはありません。
これは Google ニュースの問題ですか、それとも何か問題がありますか? それを行う方法はありますか?