0

ページのスニペットは次のとおりです。

<tr id="product_34980" class="even">
<tr id="variant_100329" class="variantRow">

34980 と 100329 を抽出したいのですが、複数の製品とバリエーションが存在する可能性があります。私はパイソンを使用します。

ありがとう

4

2 に答える 2

0

@Kirill Polishchukが提供するリンクは SO のお気に入りであり、正規表現を使用してはならない理由が明確に示されています。

ただし、まだ正規表現を使用し続ける場合は、次を試してください。

<tr[^>]*id="([^"]*)"[^>]*>

あなたの試合はキャプチャグループになりました#1

于 2013-10-16T01:47:40.600 に答える
0
>>> p = re.compile('\d+')
>>> m = re.search(p, '<tr id="product_34980" class="even">')
>>> m.group()
'34980'
于 2013-10-16T02:01:13.423 に答える