フィードパーサーを使用してRSSフィードを読み取ろうとしています。
import feedparser
url = 'http://example.com/news.xml'
d=feedparser.parse(url)
f = open('rss.dat','w')
for e in d.entries:
title = e.title
print >>f, address
f.close()
英語のRSSフィードでは正常に機能しますが、キリル文字で書かれたタイトルを表示しようとすると、UnicodeEncodeErrorが発生します。それは私が:
- ファイルにタイトルを書いてみてください。
- 画面にタイトルを表示してみてください。
- WebページにアクセスするためにURLでそれを使用してみてください。
私の質問は、この問題を簡単に解決する方法です。私はこれと同じくらい簡単な解決策を持ちたいです:
new_title = some_function(title)
すべてのキリル文字をそのHTMLコードで置き換える方法はありますか?