PHP と preg* 関数を使用して HTML スクレイピングを行おうとしたときに、この問題に何度か遭遇しました。
ほとんどの場合、次のような構造をキャプチャする必要があります。
<!-- comment -->
<tag1>lorem ipsum</tag>
<p>just more text with several html tags in it, sometimes CDATA encapsulated…</p>
<!-- /comment -->
特に、私はこのようなものが欲しいです:
/<tag1>(.*?)<\/tag1>\n\n<p>(.*?)<\/p>/mi
しかし、\n\nは機能しないようです。
一般的な改行スイッチはありますか?