RSS 2.0 フィードのタイトル タグを、そのフィードのエントリごとに 3 つの異なる変数に解析しようとしています。ElementTree を使用して、RSS を既に解析したので、各タイトル [末尾のを除く)
] を以下のコードで印刷できます。
feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date") for item in feed: print repr(item.title[0:-1])
これを含めているのは、ご覧のとおり、 item.title が repr() データ型であるためです。これについてはよくわかりません。
インタラクティブ ウィンドウの特定のrepr(item.title[0:-1])
print
ed は次のようになります。
'randy travis (Billy Bobs 3/21' 'Michael Schenker Group (House of Blues Dallas 3/26'
item.title
ユーザーがバンドを選択し、それぞれを 3 つの変数 (バンド、会場、日付にそれぞれ 1 つ... または配列か、わかりません...)に解析した後、バンドに関連するものだけを選択したいと考えています。選択されました。その後、ジオコーディングのために Google に送信されますが、それは別の話です。
いくつかの例を見てきましregex
たが、それらについて読んでいますが、非常に複雑に思えます。それは...ですか?ここにいる誰かが、これをインテリジェントな方法で正確に行う方法について洞察を持っているのではないかと思いました。re
モジュールを使用する必要がありますか? 出力が現在 s であることは重要repr()
ですか? より良い方法はありますか?私は次のようなループを使用することを考えていました (これは私の pseudoPython であり、私が書いているメモのようなものです):
list = bandRaw,venue,date,latLong フィード内のアイテム: bandRaw、会場、日付の item.title を解析します if bandRaw == str(バンド) 会場名 + 「テキサス州ダラス」を Google に送信して、ジオコーディングを行います 緯度、経度を返す リスト = リスト + リターン文字 + bandRaw + "," + 会場 + "," + 日付 + "," + lat + "," + ロング そうしないと
最後に、次のような .csv (カンマ区切り) ファイルに選択したエントリを含める必要があります。
band,venue,date,lat,long randy travis,Billy Bobs,3/21,1234.5678,1234.5678 Michael Schenker Group,House of Blues Dallas,3/26,4321.8765,4321.8765
これが多すぎないことを願っています。私は自分でそれを調べます.答えが得られることを確認するためにここに投稿する必要があると思いました.
問題は、それぞれrepr(item.title[0:-1])
をfeed
3 つの個別の値に解析して、.csv ファイルに連結できるようにするにはどうすればよいかということです。