次のようなリンクがあります。
<a href="http://illegallink.com"><img src="something.jpg" /><a href="http://legallink.com">legal</a></a>
「legallink.com」を含まないすべてのリンクを削除したい。でも内容はそのまま。したがって、上記の入力は次のように出力されます。
<img src="something.jpg" /><a href="http://legallink.com">legal</a>
リンクを介して再帰的に機能するはずです。
すべてのリンクを削除するこの正規表現を見つけました:/<\\/?a(\\s+.*?>|>)/
が、href が legallink.com であるリンクを保持したい。
これは正規表現で行うことができますか? または、DOM パーサーを使用する必要がありますか?