こんにちは、特定のサイトからの RSS フィードのダウンロードと読み込みで問題が発生しています。問題は、ダウンロードした結果の RSS フィードがバイナリ形式のように見えることです。これを読み取り可能な形式に戻す方法を誰か教えてください。その後、解析のために美しいスープに送信できますか?.
これまでの私のコードは次のとおりです:-
import urllib2
from BeautifulSoup import BeautifulSoup
rss_feed = urllib2.urlopen("http://kat.ph/usearch/ubuntu/?rss=1", timeout=5.0).read()
print rss_feed #will display binary not expected xml
rss_feed_soup = BeautifulSoup(rss_feed)
明確にするために、urllib2 を使用して読み取ろうとすると、結果の xml を取得できないようです。最新の Web ブラウザーで RSS フィードを表示すると、RSS が正しく表示されます。ここで何が欠けていますか? 、RSSフィードはバイナリエンコードされていますか?もしそうなら、どうすれば正しくデコードできますか?.
返信ありがとうございます。