Pythonで解析し、Pythonコードとしてファイルに出力しているXMLファイルがあります。
一部のXMLには、画面にダイアログとして表示される正規表現の値と文字列が含まれているため、維持する必要のある特殊文字がいくつかあります。コードは次のとおりですが、これはどのように行うことができますか?
XMLは少しこのように見えます。
<variable id="passportnumber" value="" type="String">
<validate>
<regularExpression fieldID="passportnumber" errorID="3007162"><![CDATA[^[a-zA-Z+:?<>;*()%="!0-9./',&\s-]{1,35}$]]></regularExpression>
</validate>
</variable>
そしてダイアログのために;
<if>
<condition><![CDATA[$taxcode$ == $previousemergencytaxcode$ and $previousemergencytaxcode$ != $emergencytaxcode$]]></condition>
<then>
<dialog id="taxCodeOutdatedDialog" text="Are you sure this is the correct tax
code? The emergency code for the tax year 2011-12 was
'$previousemergencytaxcode$'. The emergency code for the tax
year 2012-13 is '$emergencytaxcode$'. Proceed?" type="YES|NO|CANCEL" />
</then>
</if>
完全なPythonスクリプトはここにあり、これら2つを解析するための詳細は次のとおりです。
def parse_regularExpression(self, elem):
self.out('')
self.out("item_regularExpression(fieldID='{0}', value='{1}')".format(elem.attrib['fieldID'],elem.text))
def parse_dialog(self, elem):
self.out('')
self.out("item_dialog(id='{0}', text='{1}', type='{2}')".format(elem.attrib['id'], elem.attrib['text'],elem.attrib['type']))
改行(
)は、私がどのように対処するかわからない主なものです。etreeは、トリプルクォートされていても、それを損益分岐点として出力しているようです。テキスト値を次のように出力します。
item_dialog(id='taxCodeOutdatedDialog', text='Are you sure this is the correct tax code?
The emergency code for the tax year 2011-12 was '$previousemergencytaxcode$'.
The emergency code for the tax year 2012-13 is '$emergencytaxcode$'.
Proceed?', type='YES|NO|CANCEL')