重複の可能性:
文字列の � を置き換える方法
データベースから出てくる XML シートからデータを読み取っています。生の出力では、「�」を意味する UTF-8 文字列であるこの文字「�」に出くわします。"�" や "�" を検索する場合、str_replace で単純な検索と削除を行うだけではうまくいきません。この文字を文字列から削除する他の方法はありますか?
アップデート:
参考までに、これは私のために文字列をクリーンアップしている関数です。
function db_utf8_convert($str)
{
$convmap = array(0x80, 0x10ffff, 0, 0xffffff);
return preg_replace('/\x{EF}\x{BF}\x{BD}/u', '', mb_encode_numericentity($str, $convmap, "UTF-8"));
}