0

CSVファイルを生成しています。場合によっては、データ ソースがアクセントなどを含む文字を渡すことがあります。UTF-8 文字を検出して取り除く合理的な簡単な方法はありますか?

4

2 に答える 2

1

入力として UTF-8 を取得していることが確実な場合は、iconv を使用して値を出力で使用しているエンコーディングに変換します。UTF-8 文字の検出はフェイルセーフではありません (値は有効な iso-8859 であるため)。 -1 文字も (または実際にはすべての 8 ビット エンコーディング)。

通常の ascii 値セット (バイト値 0 ~ 127) を使用するだけの場合は、iconv を「ascii」エンコーディングに変換して音訳することができます。

iconv("utf-8", "ascii//TRANSLIT", "Hei og hå")

結果として

hei og ha

返されます。

于 2012-08-07T22:31:48.567 に答える
0
utf8_decode($string)

ただし、これにより、utf-8 では使用できるが iso88591 では使用できない一部の文字が文字化けする可能性があります。

于 2012-08-07T22:31:18.317 に答える