HTML を解析し、不要な重複リンクを削除しようとしています。たとえば、次のコードが必要です。
<p>
Lorem ipsum amet
<a href="http://edition.cnn.com/">
Proin lacinia posuere
</a>
sit ipsum.
</p>
<p>
<a href="http://www.google.com/articles/blah">
[caption align="alignright"]
<a href="http://www.google.com/articles/blah">
<img src="http://hoohlr.dev/Picture-142-300x222.png" alt="Blah blah/Flickr " height="222" class="size-medium wp-image-4351" />
</a>
sociis magnis [/caption]
</a>
</p>
これに変換するには ([キャプション] の前のリンクと終了タグを削除します:
<p>
Lorem ipsum amet
<a href="http://edition.cnn.com/">
Proin lacinia posuere
</a>
sit ipsum.
</p>
<p>
[caption align="alignright"]
<a href="http://www.google.com/articles/blah">
<img src="http://hoohlr.dev/Picture-142-300x222.png" alt="Blah blah/Flickr " height="222" class="size-medium wp-image-4351" />
</a>
sociis magnis [/caption]
</p>
削除されるリンクは、常に [キャプション] の直前にある必要があります。php preg_replace(またはより簡単な方法)を使用してこれを行うのを手伝ってくれる人はいますか?
私は非常に感謝しています。ありがとう!
編集:OK、私は探しているものにかなり良い試みをしました. http://regexr.com?31t05およびhttp://regexr.com?31svv サイトによる回答として投稿しようとしましたが、許可されませんでした... 誰かがそれを改善できますか?