いくつかのxmlを解析するスクリプトがあります。XMLに含まれるもの:
<SD TITLE="A" FLAGS="" HOST="9511.com">
<TITLE TEXT="9511 domain"/>
<ADDR STREET="Pmb#400, San Pablo Ave" CITY="Berkeley" STATE="CA" COUNTRY="US"/>
<CREATED DATE="13-Oct-1990" DAY="13" MONTH="10" YEAR="1990"/>
<OWNER NAME="9511.Org Domain Name Proxy Agents"/>
<EMAIL ADDR="proxy@9511.org"/><LANG LEX="en" CODE="us-ascii"/>
<LINKSIN NUM="75"/><SPEED TEXT="3158" PCT="17"/>
<CHILD SRATING="0"/>
</SD>
<SD>
<POPULARITY URL="9511.com/" TEXT="1417678" SOURCE="panel"/>
</SD>
タグの「TEXT」属性値(私の場合は1417678)を取得するにはどうすればよいですか?正規表現+Pythonを使用しています。正規表現文字列:
my_value = re.findall("POPULARITY[^\d]*(\d+)", xml)
「9511」になりますが、「1417678」が必要です。