1

私はこの問題について頭を悩ませようとしています。誰かが何か解決策を持っているなら。私はhtml文字列を持っています

$html = '<div id="main">What is going on </div><div>&#1740;&#1729;&#1575;&#1722; 
&#1578;&#1608; &#1705;&#1608;&#1574;&#1740; &#1729</div>
<span>Some More Text &lt;good&gt;</span>;

これは、html エンティティ + 英字 + Unicode 文字の数字記号を含む混合 html 文字列です。Unicode 文字の数字記号のみを実際の Unicode 文字値に変換したい。失いたくないユーザーフォーマットもあります。

次の出力が欲しい

$html = '<div id="main">What is going on </div><div>‘۔سلطان محمود نے گاڑی روکتے ہوئے</div>
<span>Some More Text &lt;good&gt;</span>;

私は使用しました

html_entity_decode($html, ENT_COMPAT, 'utf-8');

しかし、これはまた、私が望まない&lt;to<&gt;to に変換します。>

他の解決策はありますか??

注: Web ページで Unicode 文字が正しく表示されないことを求めているわけではありません。正しく表示されています。Web ページは数字記号をレンダリングし、実際の Unicode 文字として表示するためです。しかし、ウェブページの後ろにも実際のユニコード文字が必要です。

4

1 に答える 1