1

私の質問は、私が使用しているXMLファイルを中心に展開しています。

<log>
<logentry
 revision="33185">
<author>glv</author>
<date>2012-08-06T21:01:52.494219Z</date>
<paths>

<path
 kind="file"
 action="M">/branches/Patch_4_2_0_Branch/text.xml</path>   

<path
 kind="dir"
 action="M">/branches/Patch_4_2_0_Branch</path>

</paths>
<msg>PATCH_BRANCH:N/A
BUG_NUMBER:N/A
FEATURE_AFFECTED:N/A
OVERVIEW:N/A
Adding the SVN log size requirement to the branch 
</msg>
  </logentry>
    </log>

ここで私がやりたいのは、これに対して「if」ステートメントを使用してxmlパスタグを調べ、それがkind=dirまたはkind=fileであるかどうかを確認することです。次に、コンテンツと呼ばれる変数へのパスを追加します。これは私がこれまでに持っているものです。私はdom.importbtwを使用しています。

xmlPath = dom.getElementsByTagName('paths')[0]
xmlPathM =  xmlPath.getAttribute('kind')    
if xmlPathM == dir:
    content += "Directory location:" + xmlPathM +"\n \n"
else:
    content += "FileName"  + xmlPathM +"\n \n "

今では動作したくないようですが、ファイル名は出力されますが、ディレクトリの場所は出力されません。私は信じていますが、このログエントリを見て、これを印刷してほしい

Directory location: /branches/Patch_4_2_0_Branch 

FileName:/branches/Patch_4_2_0_Branch/text.xml

同じログエントリに対して。私が何を見逃しているのか、間違っているのかについて何か考えはありますか?

4

1 に答える 1

4

XMLでの作業は、IPythonのような優れたインタラクティブコンソールで行うのに最適です。[補足:インターフェイスが好きなので、ElementTreeの方が好きですが、何でも]

飛び込みましょう。最初にそれを読んでください:

In [51]: import xml.dom.minidom as minidom

In [52]: dom = minidom.parse("log.xml")

In [53]: dom
Out[53]: <xml.dom.minidom.Document instance at 0x97082ec>

次に、パスの内部を見てください。

In [55]: dom.getElementsByTagName("paths")
Out[55]: [<DOM Element: paths at 0x97086cc>]

In [56]: dom.getElementsByTagName("paths")[0]
Out[56]: <DOM Element: paths at 0x97086cc>

In [57]: vars(dom.getElementsByTagName("paths")[0])
Out[57]: 
{'_attrs': {},
 '_attrsNS': {},
 'childNodes': [<DOM Text node "u'\n\n'">,
  <DOM Element: path at 0x970874c>,
  <DOM Text node "u'   \n\n'">,
  <DOM Element: path at 0x97088ac>,
  <DOM Text node "u'\n\n'">],
 'namespaceURI': None,
 'nextSibling': <DOM Text node "u'\n'">,
 'nodeName': u'paths',
 'ownerDocument': <xml.dom.minidom.Document instance at 0x97082ec>,
 'parentNode': <DOM Element: logentry at 0x970848c>,
 'prefix': None,
 'previousSibling': <DOM Text node "u'\n'">,
 'tagName': u'paths'}

見てくださいchildNodes

In [58]: dom.getElementsByTagName("paths")[0].childNodes
Out[58]: 
[<DOM Text node "u'\n\n'">,
 <DOM Element: path at 0x970874c>,
 <DOM Text node "u'   \n\n'">,
 <DOM Element: path at 0x97088ac>,
 <DOM Text node "u'\n\n'">]

空白は重要なので、それは少し頭痛の種です。ただし、非要素を破棄することはできます。

In [61]: elements = [x for x in dom.getElementsByTagName("paths")[0].childNodes if isinstance(x, minidom.Element)]

In [62]: elements
Out[62]: [<DOM Element: path at 0x970874c>, <DOM Element: path at 0x97088ac>]

中を見る:

In [65]: elements
Out[65]: [<DOM Element: path at 0x970874c>, <DOM Element: path at 0x97088ac>]

In [66]: vars(elements[0])
Out[66]: 
{'_attrs': {u'action': <xml.dom.minidom.Attr instance at 0x970880c>,
  u'kind': <xml.dom.minidom.Attr instance at 0x97087ac>},
 '_attrsNS': {(None, u'action'): <xml.dom.minidom.Attr instance at 0x970880c>,
  (None, u'kind'): <xml.dom.minidom.Attr instance at 0x97087ac>},
 'childNodes': [<DOM Text node "u'/branches/'...">],
 'namespaceURI': None,
 'nextSibling': <DOM Text node "u'   \n\n'">,
 'nodeName': u'path',
 'ownerDocument': <xml.dom.minidom.Document instance at 0x97082ec>,
 'parentNode': <DOM Element: paths at 0x97086cc>,
 'prefix': None,
 'previousSibling': <DOM Text node "u'\n\n'">,
 'tagName': u'path'}

そして最後に、私たちは何が欲しいかを知っています:

In [67]: for elem in elements:
    print elem, elem.childNodes[0].nodeValue, elem.getAttribute("kind"), elem.getAttribute("action") 
   ....:     
<DOM Element: path at 0x970874c> /branches/Patch_4_2_0_Branch/text.xml file M
<DOM Element: path at 0x97088ac> /branches/Patch_4_2_0_Branch dir M

これをインタラクティブに行わないことは想像できません。

于 2012-08-27T20:57:39.010 に答える