リモートソースからいくつかのコンテンツを取得していますが、そのうちのいくつかは次のようなキリル文字を出力します:
Щерката
ブラウザはこれを問題なく読み取ることができますが、一部のプログラムには問題があります。これを PHP のhtml_entity_decode()で実行すると、正しい文字を取得でき、テキストは次のようになります。
Щерката
問題は、html_entity_decode()が文字列内の HTML タグもデコードすることであり、それらに触れたくないのです。
HTMLタグに影響を与えずにこれを行う方法はありますか?