0

以下のようなサンプル HTML コードがあります。

<div><span>span1</span></div>
<b>for test</b>
<span>span2</span>

div タグに含まれていないすべてのスパン タグを取得する方法はありますか (このサンプルでは: span2)

この投稿C# 正規表現 によると、文字列を除外すると、これは私のパターンですが、機能しません。パターン:((?:(?!\b<div>\b))*)((.|\n)*?)<span>((.|\n)*?)</span>((.|\n)*?)((?:(?!\b</div>\b))*)

4

1 に答える 1

3

HTML を解析するために正規表現を使用したくはありません。このスタック オーバーフローの質問で多くの理由について詳しく読むことができます: RegEx は、XHTML 自己完結型タグを除くオープン タグに一致します。

Html Agility Packのような HTML パーサー、またはXMLReaderのような単純な XML パーサーを使用する必要があります。

于 2013-03-27T04:33:56.300 に答える