2

文字列のイニシャル「Wrs」を分離したい

"agendapunt 5.4 (GAIA) asdf <BR>    Wrs    <BR>         medegedeeld"

これは私が使用している正規表現です:

(?<!<BR>)(\s{2,}[a-z]+\s{2,})(?=<BR>)

イニシャル「Wrs」の後には、少なくとも 2 つのスペースが続き、その後に html の区切りが必要<BR>です。また、イニシャル「Wrs」の前には少なくとも 2 つのスペースが必要であり、HTML<BR>タグを前に置いてはなりません。

残念ながら、上記の例では、前の<BR>タグを使用しても、イニシャルの肯定的な一致がまだあります。理由がわかりません。なぜなら、ポジティブな先読みが期待どおりに機能しているように見えるからです。入力文字列から2 番目のタグまたはその一部を削除する<BR>と、一致するものが見つかりません。

また、負の後読みの代わりに正の後読みを使用して、それが何をするかを確認してみましたが、期待どおりに機能します。この場合、肯定的および否定的なルックアラウンドは同じルールでは機能しないようです。

私が間違っていることは何か分かりますか?

4

1 に答える 1