0

これを解析しようとしています: http://www.codespot.blogspot.in/atom.xml?redirect=false&start-index=1&max-results=500

問題は:

  1. ElementTreeが解析するためにxmlをファイルに保存する必要があります。それを回避し、GET 要求からの文字列応答を解析する方法は?

  2. 私はこれを行っていますが、すべてのタイトルを取得するために、まだ機能しません:

    f = open('output.xml','wb+')
        f.write(r.content)
        f.close()
        tree = ""
        with open('output.xml', 'rt') as f:
            tree = ElementTree.parse(f)
            print tree
            root = tree.getroot()
            for elem in tree.iter():
                print elem.tag, elem.attrib
            for atype in tree.findall('title'):
                print atype.contents
    
4

1 に答える 1

2
import urllib2
from xml.etree import cElementTree as ET
conn = urllib2.urlopen("http://www.codespot.blogspot.in/atom.xml?redirect=false&start-index=1&max-results=500")
myins=ET.parse(conn)
for elem in myins.findall('{http://www.w3.org/2005/Atom}entry/{http://www.w3.org/2005/Atom}title'):
    print elem.text

または、タイトルとコンテンツの両方を見つける::

for elem in myins.findall('{http://www.w3.org/2005/Atom}entry'):
    print elem.find('{http://www.w3.org/2005/Atom}title').text ## this will be the title
    print elem.find('{http://www.w3.org/2005/Atom}content').text ## this will be the content
于 2013-04-17T05:08:06.317 に答える