0

Web ブログ ページを解析し、特定のデータをリストに抽出しようとしています。これがxmlです..

http://www-01.ibm.com/software/support/lifecycle/rss/PLCWeeklyXMLDownload.xml

複数のレコードがありますが、それぞれからソフトウェア タイトル、バージョン番号、リリース番号、ModLevelNumber、およびサービス終了日 (ある場合) を引き出してリストに入れる必要があります。

私はpythonコードを実行していますが、xmlは初めてです。助けていただければ幸いです

 def myDownload():
   import xml.etree.ElementTree as et
   import urllib.request
   response = urllib.request.urlopen("http://www-01.ibm.com/software/support/lifecycle/rss/PLCWeeklyXMLDownload.xml")
   tree = et.parse(response)
   root = tree.getroot()
   aList=[]

   for child in root:
      for node in child.findall("SWTitle"):
        title = node.text
        aList.append(title)
      for nodes in child.findall("Versions"):
        for version in nodes.findall("Version"):
          for release in version.findall("Release_Mods"):
            for mod in release.findall("Release_Mod"):
              rNum = mod.find("releaseNumber")
              rNumber = rNum.text
              nNum = mod.find("modLevelNumber")
              nNumber=nNum.text
              aList.append(rNumber)
              aList.append(nNumer)

機能していないように見えるため、誰でもこのコードを調整できますか

4

2 に答える 2

1

lxml ライブラリを使用して xml を解析します。ElementTree は、より多くのネストされたタグでは機能しません。

于 2013-05-02T12:25:42.673 に答える