regex - Python で使用する正規表現の作成に助けが必要

Question

ページのスニペットは次のとおりです。

<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">

34980 と 100329 を抽出したいのですが、複数の製品とバリエーションが存在する可能性があります。私はパイソンを使用します。

ありがとう

score 0 · Accepted Answer

@Kirill Polishchukが提供するリンクは SO のお気に入りであり、正規表現を使用してはならない理由が明確に示されています。

ただし、まだ正規表現を使用し続ける場合は、次を試してください。

<tr[^>]*id="([^"]*)"[^>]*>

あなたの試合はキャプチャグループになりました#1

score 0 · Accepted Answer

>>> p = re.compile('\d+')
>>> m = re.search(p, '<tr id="product_34980" class="even">')
>>> m.group()
'34980'

2 に答える 2