Beautiful Soup を使用して、Python で XML から値 (のみ) を取得しようとしています (ただし、推奨される場合は、喜んでダンプします)。次のコードを検討してください。
global humidity, temperature, weatherdescription, winddescription
query = urllib2.urlopen('http://www.google.com/ig/api?weather="Aberdeen+Scotland"')
weatherxml = query.read()
weathersoup = BeautifulSoup(weatherxml)
query.close()
print weatherxml
これにより、スコットランドのアバディーンの天気予報が XML (現在) として出力されます (巨大なテキストの壁症候群を防ぐために、多くの XML が削除されています)。
<?xml version="1.0"?><xml_api_reply version="1"><weather module_id="0"
tab_id="0" mobile_row="0" mobile_zipped="1" row="0" section="0"
><forecast_information><city data="Aberdeen, Aberdeen City"/><postal_code data=""Aberdeen Scotland""/><latitude_e6
data=""/><longitude_e6 data=""/><forecast_date
data="2012-07-31"/><current_date_time data="1970-01-01 00:00:00
+0000"/><unit_system data="US"/></forecast_information><current_conditions><condition
data="Clear"/><temp_f data="55"/><temp_c data="13"/><humidity
data="Humidity: 82%"/><icon
data="/ig/images/weather/sunny.gif"/><wind_condition data="Wind: SE at
8 mph"/></current_conditions>
たとえば、この XML で天気の値を変数に入力できるようにしたいと考えています。
weathersoup で検索関数を使用すると、タグ全体 (たとえば、temp_c の場合は が返されます"<temp_c data="13">
) が取得されますが、他のさまざまな関数では何も返されないか、シート全体またはその一部が返されます。
「ストリップ」を混乱させたり、正規表現に頼ったり、基本的にハッキングしたりせずに、特定の XML タグの VALUE を単純に返すにはどうすればよいですか?