xml データを分析しようとしていますが、使用時に HTML エンティティに関する問題が発生しました。
import xml.etree.ElementTree as ET
tree = ET.parse(my_xml_file)
root = tree.getroot()
for regex_rule in root.findall('.//regex_rule'):
print(regex_rule.get('input')) #this ".get()" method turns < into <, but I want to get < as written
print(regex_rule.get('input') == "(?<!\S)hello(?!\S)") #prints out false because ElementTree's get method turns < into < , is that right?
xml ファイルの内容は次のとおりです。
<rules>
<regex_rule input="(?<!\S)hello(?!\S)" output="world"/>
</rules>
変換せずに、入力のxml属性から文字列をそのまま取得するように誰かに指示していただければ幸いです
<
の中へ
<