私はいくつかの投稿を調べましたが、私の問題を解決する答えはまったく見つかりませんでした。
サンプルXML=
<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/>
</TextWithNodes>
だから私は通常、私がとして抽出TextWithNodes
した場合、NodeList
私は次のようなことをするだろうと理解しています
nodeList = TextWithNodes[0].getElementsByTagName('Node')
for a in nodeList:
node = a.nodeValue
print node
私が得るのはNone
。書き込む必要があることを読みましたが、すべてのIDがタグを閉じa.childNodes.nodeValue
ているように見えるため、ノードリストに子ノードがありませんか?Node
使用するa.childNodes
と取得し[]
ます。
ノードタイプを取得すると、a
タイプ1およびTEXT_NODE
=3になります。それが役立つかどうかはわかりません。
TEXT1
、、などを抽出したいのですがTEXT2
。