php - mb_convert_encoding() を使用して文字列を HTML-ENTITES から UTF-8 に変換し、その逆に変換する

翻译自：https://stackoverflow.com/questions/37998968 2016-06-23T18:14:23.423

517 次

文字列の文字エンコーディングを HTML-ENTITIES に変換してから、utf-8 に戻したいと考えています。エンコーディングに変換して元に戻すと、同じ文字列が残るはずだと思いましたが、そうではありません。

私のテスト文字列は次のとおりです。

Test: ěščřžýáíé'

HTML-ENTITIES への変換

echo mb_convert_encoding('Test: ěščřžýáíé', 'HTML-ENTITIES', 'UTF-8');

この結果を出力します:

Test: ě&scaron;čřžýáíé

ただし、utf-8に戻そうとすると

echo mb_convert_encoding('Test: &#283;&scaron;&#269;&#345;&#382;&yacute;&aacute;&iacute;&eacute;', 'UTF-8', 'HTML-ENTITIES');

驚くべきことに、元の文字列ではなく、(間違った) 出力が得られます。

エンコーディングを適切に変換して元の文字列を取り戻すにはどうすればよいですか?

0 に答える 0