正規表現を使用して、html コードから URL を取得しようとしています。正規表現についてあまり知らないので、うまくいかないので少し混乱しています。これはケースです:
<a href="cotizacion-valor/abengoa/" style="text-decoration:none;color:#006699;">ABG.MC</a>
そして、この正規表現を使用して「abengoa」を取得しようとしています:
".*cotizacion-valor\/(/w+)\/.*"
また、私はpythonを使用しているので、コードは次のとおりです。
regex_companies = ".*cotizacion-valor\/(/w+)\/.*"
match_companies = re.findall(regex_companies, content_web)
私の正規表現の何が悪いのですか? ありがとう
編集:もう1つの質問:
最初の一致のみを取得するにはどうすればよいですか? この href は同じ内容のドキュメントに沿って繰り返されているためです (ただし、異なる内容もあるため、すべてを検索する必要があります)。