re.findall() を使用して、HTML ファイルからいくつかのバージョン番号を抽出しています。
>>> import re
>>> text = "<table><td><a href=\"url\">Test0.2.1.zip</a></td><td>Test0.2.1</td></table> Test0.2.1"
>>> re.findall("Test([\.0-9]*)", text)
['0.2.1.', '0.2.1', '0.2.1']
しかし、ドットで終わらないものだけを取得したいと思います。ファイル名が常に .zip であるとは限らないため、.zip を正規表現に貼り付けることはできません。
私はで終わりたい:
['0.2.1', '0.2.1']
誰かが使用するより良い正規表現を提案できますか? :)