テキスト ファイルを解析するときに、xml ツリーに二重ブランチを作成しないようにする必要があります。テキストファイルが次のようになっているとします (行の順序はランダムです)。
branch1:branch11:message11
branch1:branch12:message12
branch2:branch21:message21
branch2:branch22:message22
したがって、結果の xml ツリーには、2 つのブランチを持つルートが必要です。これらのブランチには両方とも 2 つのサブブランチがあります。このテキスト ファイルを解析するために使用する Python コードは次のとおりです。
import string
fh = open ('xmlbasic.txt', 'r')
allLines = fh.readlines()
fh.close()
import xml.etree.ElementTree as ET
root = ET.Element('root')
for line in allLines:
tempv = line.split(':')
branch1 = ET.SubElement(root, tempv[0])
branch2 = ET.SubElement(branch1, tempv[1])
branch2.text = tempv[2]
tree = ET.ElementTree(root)
tree.write('xmlbasictree.xml')
このコードの問題は、テキストファイルの各行で xml ツリーのブランチが作成されることです。
この名前のブランチが既に存在する場合、xml ツリーに別のブランチを作成しないようにする方法はありますか?