URLからダウンロードしたxmlファイルがあります。次に、xml を反復処理して、特定のファイル拡張子を持つファイルへのリンクを見つけたいと思います。
私のxmlは次のようになります。
<Foo>
<bar>
<file url="http://foo.txt"/>
<file url="http://bar.doc"/>
</bar>
</Foo>
次のようなxmlファイルを取得するコードを作成しました。
import urllib2, re
from xml.dom.minidom import parseString
file = urllib2.urlopen('http://foobar.xml')
data = file.read()
file.close()
dom = parseString(data)
xmlTag = dom.getElementsByTagName('file')
そして、私はこのようなものを機能させたいと思っています:
i=0
url = ''
while( i < len(xmlTag)):
if re.search('*.txt', xmlTag[i].toxml() ) is not None:
url = xmlTag[i].toxml()
i = i + 1;
** Some code that parses out the url **
しかし、それはエラーをスローします。より良いアプローチに関するヒントはありますか?
ありがとう!