ページのスニペットは次のとおりです。
<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">
34980 と 100329 を抽出したいのですが、複数の製品とバリエーションが存在する可能性があります。私はパイソンを使用します。
ありがとう
ページのスニペットは次のとおりです。
<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">
34980 と 100329 を抽出したいのですが、複数の製品とバリエーションが存在する可能性があります。私はパイソンを使用します。
ありがとう
@Kirill Polishchukが提供するリンクは SO のお気に入りであり、正規表現を使用してはならない理由が明確に示されています。
ただし、まだ正規表現を使用し続ける場合は、次を試してください。
<tr[^>]*id="([^"]*)"[^>]*>
あなたの試合はキャプチャグループになりました#1
>>> p = re.compile('\d+')
>>> m = re.search(p, '<tr id="product_34980" class="even">')
>>> m.group()
'34980'