テキストから HTML タグを削除しようとしています。ただし、問題は、私が使用するものは何でも-正規表現、strip_tagsなどです.同じ問題に遭遇します.HTMLではなく、HTMLのように見えるテキストも削除されます。
Some <foo@bar.com> Content--> Some Content
Some <Content which looks like this --> Some
これを回避する方法はありますか?
テキストから HTML タグを削除しようとしています。ただし、問題は、私が使用するものは何でも-正規表現、strip_tagsなどです.同じ問題に遭遇します.HTMLではなく、HTMLのように見えるテキストも削除されます。
Some <foo@bar.com> Content--> Some Content
Some <Content which looks like this --> Some
これを回避する方法はありますか?
HTML purifierライブラリを試しましたか? すべてのタグを削除するように構成できます。このライブラリは非常に信頼できることがわかりました。