1

こんにちは、ElementTree を使用して Kuler からの xml フィードを解析しています。私はPythonを始めたばかりですが、ここで立ち往生しています。「:」を含むノードを取得しようとするまで、解析は正常に機能します。例: kuler:swatchHexColor

以下は完全なフィードの縮小版ですが、構造は同じです:

<rss xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:kuler="http://kuler.adobe.com/kuler/API/rss/" xmlns:rss="http://blogs.law.harvard.edu/tech/rss" version="2.0">
 <channel>
 <title>kuler popular themes</title>
 <item>
 <title>Theme Title: Fresh Money</title>
 <description> 
 &lt;img src="http://kuler-api.adobe.com/kuler/themeImages/theme_808366.png" /&gt;&lt;br /&gt;

 Artist: thesylph005&lt;br /&gt;
 ThemeID: 808366&lt;br /&gt;
 Posted: 03/02/2010&lt;br /&gt;

 Hex:
 2F400D, 8CBF26, A8CA65, E8E5B0, 419184
</description>
<kuler:themeItem>
<kuler:themeID>808366</kuler:themeID>
<kuler:themeTitle>Fresh Money</kuler:themeTitle>
<kuler:themeImage>http://kuler-api.adobe.com/kuler/themeImages/theme_808366.png</kuler:themeImage>
<kuler:themeAuthor>
 <kuler:authorID>370750</kuler:authorID>
 <kuler:authorLabel>thesylph005</kuler:authorLabel>
</kuler:themeAuthor>
<kuler:themeTags/>
<kuler:themeRating>4</kuler:themeRating>
<kuler:themeDownloadCount>708</kuler:themeDownloadCount>
<kuler:themeCreatedAt>20100302</kuler:themeCreatedAt>
<kuler:themeEditedAt>20100302</kuler:themeEditedAt>
<kuler:themeSwatches>
 <kuler:swatch>
  <kuler:swatchHexColor>2F400D</kuler:swatchHexColor>
  <kuler:swatchColorMode>rgb</kuler:swatchColorMode>
  <kuler:swatchChannel1>0.183333</kuler:swatchChannel1>
  <kuler:swatchChannel2>0.25</kuler:swatchChannel2>
  <kuler:swatchChannel3>0.05</kuler:swatchChannel3>
  <kuler:swatchChannel4>0.0</kuler:swatchChannel4>
  <kuler:swatchIndex>0</kuler:swatchIndex>
 </kuler:swatch>
 <kuler:swatch>
  <kuler:swatchHexColor>8CBF26</kuler:swatchHexColor>
  <kuler:swatchColorMode>rgb</kuler:swatchColorMode>
  <kuler:swatchChannel1>0.55</kuler:swatchChannel1>
  <kuler:swatchChannel2>0.75</kuler:swatchChannel2>
  <kuler:swatchChannel3>0.15</kuler:swatchChannel3>
  <kuler:swatchChannel4>0.0</kuler:swatchChannel4>
  <kuler:swatchIndex>1</kuler:swatchIndex>
 </kuler:swatch>
 <kuler:swatch>
  <kuler:swatchHexColor>A8CA65</kuler:swatchHexColor>
  <kuler:swatchColorMode>rgb</kuler:swatchColorMode>
  <kuler:swatchChannel1>0.659722</kuler:swatchChannel1>
  <kuler:swatchChannel2>0.791667</kuler:swatchChannel2>
  <kuler:swatchChannel3>0.395833</kuler:swatchChannel3>
  <kuler:swatchChannel4>0.0</kuler:swatchChannel4>
  <kuler:swatchIndex>2</kuler:swatchIndex>
 </kuler:swatch>
 <kuler:swatch>
  <kuler:swatchHexColor>E8E5B0</kuler:swatchHexColor>
  <kuler:swatchColorMode>rgb</kuler:swatchColorMode>
  <kuler:swatchChannel1>0.91</kuler:swatchChannel1>
  <kuler:swatchChannel2>0.898047</kuler:swatchChannel2>
  <kuler:swatchChannel3>0.688705</kuler:swatchChannel3>
  <kuler:swatchChannel4>0.0</kuler:swatchChannel4>
  <kuler:swatchIndex>3</kuler:swatchIndex>
 </kuler:swatch>
 <kuler:swatch>
  <kuler:swatchHexColor>419184</kuler:swatchHexColor>
  <kuler:swatchColorMode>rgb</kuler:swatchColorMode>
  <kuler:swatchChannel1>0.254901</kuler:swatchChannel1>
  <kuler:swatchChannel2>0.57</kuler:swatchChannel2>
  <kuler:swatchChannel3>0.519034</kuler:swatchChannel3>
  <kuler:swatchChannel4>0.0</kuler:swatchChannel4>
  <kuler:swatchIndex>4</kuler:swatchIndex>
 </kuler:swatch>
</kuler:themeSwatches>

2010 年 3 月 30 日 (火) 11:27:12 PST

したがって、各アイテムの説明についてfindallを実行すると、問題なく返されます。しかし、ノード名に : を含むものを取得しようとすると、例外タイプ: KeyError 例外値: ':' が発生します。

だからこれはうまくいく

from elementtree.ElementTree import Element, SubElement, dump, parse
def xml():
    kulerurl = 'http://kuler-api.adobe.com/rss/get.cfm?listType=popular&startIndex=0&itemsPerPage=5&timeSpan=30&key=mykey'
    rss = parse(urllib.urlopen(kulerurl)).getroot()
    for element in rss.findall('channel/item'):
        print(element.findtext('description'))
    dump (rss)

しかし、これはそうではありません

def xml():
    kulerurl = 'http://kuler-api.adobe.com/rss/get.cfm?listType=popular&startIndex=0&itemsPerPage=5&timeSpan=30&key=mykey'
    rss = parse(urllib.urlopen(kulerurl)).getroot()
    for element in rss.findall('channel/item/kuler:themeItem'):
        print(element.findtext('kuler:themeID'))
    dump (rss)

ここで私が間違っていることを誰かが私に指摘できれば、それは簡単なことだと確信しています。私は最も感謝しています

ありがとうキーラン

4

1 に答える 1

1

この記事(およびこの記事へのコメント) に基づいて、名前空間名を実際の URI に置き換える必要があると思います (コロンを削除して に入れます{})。

namespace = 'http://kuler.adobe.com/kuler/API/rss/'

def xml():
    kulerurl = 'http://kuler-api.adobe.com/rss/get.cfm?listType=popular&startIndex=0&itemsPerPage=5&timeSpan=30&key=mykey'
    rss = parse(urllib.urlopen(kulerurl)).getroot()
    for element in rss.findall('channel/item/{%s}themeItem' % namespace):
        print(element.findtext('{%s}themeID' % namespace))
    dump (rss)

[XML 名前空間]
要素の型は、"<strong>{uri}local" という形式の文字列として、ユニバーサル名とも呼ばれる修飾名のペアを表します。この構文は、タグ名と属性キーの両方に使用できます。

ElementTree が名前空間を処理する方法について、この概要を参照してください。

于 2010-03-30T22:48:37.950 に答える