0

この種の線を一致させる方法

<p><span class="font7" style="font-weight:bold;">text text text text </span></p>\r\n<p>

同時に、この種の線を避けてください

<p><span class="font7" style="font-weight:bold;">text text text text </span><span class="font7"> text text text <br/> text text text </span></p>\r\n<p>

問題は、タグスパンが同じ行に2回表示されることです。これは、避けたいと思います。1行に1回だけ表示される場合にのみ必要です。

</span> 

私はこの正規表現を試しました

<p><span class="font7" style="font-weight:bold;">.+?(?:(?!.+?</span>.+?$)){2}</p>\r\n<p>

可能であれば、.net、perl、またはrubyフレーバーで私を助けてください

あいさつ

4

1 に答える 1

1

HTML を正規表現で解析しようとしないでください。確実に行うことはできません。正規表現は、そのタスクに対応していません。

適切な HTML パーサーが必要です。これは、よくテストされ、多くの人が使用している HTML パーサーであり、組み合わせようとする正規表現とは対照的です。

Perl HTML パーサーのオプションを次に示します。そこから始めましょう。

于 2012-12-15T03:38:01.270 に答える