0

以下の html コンテンツがあります。正規表現を使用して 31673 31672 3166 316 のような ID のみを抽出します。

<a href="/CaseMgrTesting/Pat/Summary/31673">31673</a>
<a href="/CaseMgrTesting/Pat/Summary/31672">31672</a>
<a href="/CaseMgrTesting/Pat/Summary/3166">3166</a>
<a href="/CaseMgrTesting/Pat/Summary/316">316</a>

以下のような正規表現を作成しますが、残念ながら 31673 31672 しか返されません。また、 href="/CaseMgrTesting/Pat/Summary/ や \d\d​​\d\d\d などのハードコードを削除したいです。正しい正規表現を教えてください。大変感謝いたします。

(?<=<a\shref="/CaseMgrTesting/Pat/Summary/\d\d\d\d\d">).*(?=</a>)
4

3 に答える 3

1
<a .*?>(.*)</a>

この質問にはこの正規表現を使用してください。その簡単なものを試してみてください。

于 2014-02-17T10:07:25.033 に答える
1

あなたのワンストップの答えは Html Agility Packです。この気の利いた必須アイテムを使用すると、ノードごとに HTML にアプローチできます。学べ。それを生きる。大好きです。

于 2012-12-19T19:06:56.537 に答える
0

これを使用します(正規表現の更新された回答):

<a .*?>(.*?)</a>

これの重要な部分は、 の?*です。これにより、.*(すべてに一致)非貪欲になります。そうしないと、一致するのは最大で1つになります。

于 2014-02-17T10:28:08.930 に答える