1

HTMLをプレーンテキストに変換しようとしています。たくさんあります&\#8217; &\#8220;

私が試してみました:

  1. html2textコマンドライン
  2. html_entity_decode+ ENT_QUOTES|ENT_HTML401 UTF-8
  3. html_entity_decode(htmlentities($str))
  4. strip_tags
  5. trim

それは他のものをきれいにするのに大いに役立ちました、しかしそれら&\#8217; “は修正されません。どうすれば正しく変換できますか?

4

1 に答える 1

1

「htmlspecialchars_decode」を試しましたか

<?php
$str = "<p>this -&gt; &quot;</p>\n";
echo htmlspecialchars_decode($str);
// note that here the quotes aren't converted
echo htmlspecialchars_decode($str, ENT_NOQUOTES);
?>

上記の例では、次のように出力されます。

<p>this -> "</p>
<p>this -> &quot;</p>
于 2012-11-19T09:51:56.100 に答える