タグから URL を除外するなど、正規表現を使用して文字列から値をフィルタリングしようとしています。<a href=""/>
<a href="http://www.example.com">
reライブラリを調べたところ、文字列に一致する正規表現は
r'<a href="(.*)">'
この値を変数に保存する最良の方法は何ですか?
正規表現でhtmlを解析するべきではありませんが、それは単なる例であると言ったので...
常に一致が見つかると予想される場合:
try:
foo = re.search(r'<a href="(.*)">', text).group(1)
except AttributeError:
foo = None
一致するかどうかわからない場合:
match = re.search(r'<a href="(.*)">', text)
if match:
foo = match.group(1)
else:
foo = None