python - 正規表現を使用して文字列から値をフィルター処理する

Question

タグから URL を除外するなど、正規表現を使用して文字列から値をフィルタリングしようとしています。<a href=""/>

<a href="http://www.example.com">

reライブラリを調べたところ、文字列に一致する正規表現は

r'<a href="(.*)">'

この値を変数に保存する最良の方法は何ですか?

score 2 · Accepted Answer

正規表現でhtmlを解析するべきではありませんが、それは単なる例であると言ったので...
常に一致が見つかると予想される場合:

try:
    foo = re.search(r'<a href="(.*)">', text).group(1)
except AttributeError:
    foo = None

一致するかどうかわからない場合:

match = re.search(r'<a href="(.*)">', text)
if match:
    foo = match.group(1)
else:
    foo = None

1 に答える 1