0

リモートソースからいくつかのコンテンツを取得していますが、そのうちのいくつかは次のようなキリル文字を出力します:

Щерката

ブラウザはこれを問題なく読み取ることができますが、一部のプログラムには問題があります。これを PHP のhtml_entity_decode()で実行すると、正しい文字を取得でき、テキストは次のようになります。

Щерката

問題は、html_entity_decode()が文字列内の HTML タグもデコードすることであり、それらに触れたくないのです。

HTMLタグに影響を与えずにこれを行う方法はありますか?

4

2 に答える 2

0
var_dump(htmlspecialchars(html_entity_decode('Щ<b>')));

私に与えます:

string(11) "Щ<b>"
于 2013-08-13T06:09:07.983 に答える
0

<最初にシーケンスと>シーケンスをシンプルに(ダブル) エンコードしてからstr_replace()、デコードを行います

于 2013-08-13T06:05:22.300 に答える