次のラベルを持つすべての単語を抽出したい"w="
. 例、" THAT HAVE RECEIVED NO"
以下の文字列から必要になります。
w="THAT" v="22.23092" a="19.09109" i="3"/>
<r s="1480150" d="150" w="HAVE" v="20.66713" a="19.09183" i="3"/>
<r s="1480300" d="360" w="RECEIVED" v="18.70063" a="19.09165" i="2"/>
<r s="1480660" d="200" w="-SIL-" v="11.65527" a="19.09165" i="0"/>
<r s="1480860" d="210" w="NO" v="18.49828" a="19.09137" i="2"/>
<r s="1481070" d="4330" w="-S-" v="11.55029" a="19.09137" i="0"/>
<r s="1485400" d="4170" w="-S-" v="11.88606" a="19.09137" i="0"/>
私は次の正規表現を使用しようとしています:
matches = re.findall('(?<=[w][=])\w+',line)
しかし、うまくいかないようです。助けてください。