HTMLをプレーンテキストに変換しようとしています。たくさんあります&\#8217;
&\#8220;
。
私が試してみました:
html2text
コマンドラインhtml_entity_decode
+ENT_QUOTES
|ENT_HTML401
UTF-8
html_entity_decode(htmlentities($str))
strip_tags
trim
それは他のものをきれいにするのに大いに役立ちました、しかしそれら&\#8217;
“
は修正されません。どうすれば正しく変換できますか?