私はこの問題について頭を悩ませようとしています。誰かが何か解決策を持っているなら。私はhtml文字列を持っています
$html = '<div id="main">What is going on </div><div>یہاں
تو کوئی ہ</div>
<span>Some More Text <good></span>;
これは、html エンティティ + 英字 + Unicode 文字の数字記号を含む混合 html 文字列です。Unicode 文字の数字記号のみを実際の Unicode 文字値に変換したい。失いたくないユーザーフォーマットもあります。
次の出力が欲しい
$html = '<div id="main">What is going on </div><div>‘۔سلطان محمود نے گاڑی روکتے ہوئے</div>
<span>Some More Text <good></span>;
私は使用しました
html_entity_decode($html, ENT_COMPAT, 'utf-8');
しかし、これはまた、私が望まない<
to<
と>
to に変換します。>
他の解決策はありますか??
注: Web ページで Unicode 文字が正しく表示されないことを求めているわけではありません。正しく表示されています。Web ページは数字記号をレンダリングし、実際の Unicode 文字として表示するためです。しかし、ウェブページの後ろにも実際のユニコード文字が必要です。