Webページの解析中に、無効なDOM構造が原因でパーサーが停止します。特定のノードを交換して修正したい。
</div>
パーサーを停止させる余分なものがあることがわかりました。
チェックする正規表現を作成する必要があります:もしあれば、</div>
その後に</div>
[つまり<div>
、間に開始タグがありません。タグにはフォローするIDまたはクラスがある可能性があるためチェック <div
されます]、最後</div>
は。に置き換えられ<div></div>
ます。
つまり、</div>
その後にが続く場合</div>
、最後の1つはに置き換えられ<div></div>
ます。
前もって感謝します。
例:
<div>
<img src="/lexus-share/images/spacer.gif" width="2" height="15" border="0" alt="">
</div>
<a href="http://www.somedomain.com"><img src="/pub-share/images.jpg"></a>
</div>