HTML エンティティを UTF-8 に変換したいのですが、mb_convert_encoding
すでに UTF-8 でエンコードされている文字を破棄します。正しい方法は?
$text = "äöü ä ö ü ß";
var_dump(mb_convert_encoding($text, 'UTF-8', 'HTML-ENTITIES'));
// string(24) "äöü ä ö ü ß"
HTML エンティティを UTF-8 に変換したいのですが、mb_convert_encoding
すでに UTF-8 でエンコードされている文字を破棄します。正しい方法は?
$text = "äöü ä ö ü ß";
var_dump(mb_convert_encoding($text, 'UTF-8', 'HTML-ENTITIES'));
// string(24) "äöü ä ö ü ß"
mb_convert_encoding()
あなたが達成しようとしているもののための正しい関数ではありません:実際の html エンティティを UTF-8 に変換するだけで、既存の UTF-8 文字には影響しないため、代わりにhtml_entity_decode()を実際に使用する必要があります文字列で。
$text = "äöü ä ö ü ß";
var_dump(html_entity_decode($text, ENT_COMPAT | ENT_HTML401, 'UTF-8'));
を与える
string(18) "äöü ä ö ü ß"