PHPのIconvと同じように、Javascriptを使用してUTF-8の文字を最も近いASCII文字に「変換」する方法を考えています。
例:
üはuになります
óはoになります
置換を使用したくないのは、a)完全な文字セットが必要であり、これは多くの作業であり、b)完全な文字セットを取得するのは困難であり、確信が持てないためです。 1つか2つ欠けている場合。
PHPのIconvと同じように、Javascriptを使用してUTF-8の文字を最も近いASCII文字に「変換」する方法を考えています。
例:
üはuになります
óはoになります
置換を使用したくないのは、a)完全な文字セットが必要であり、これは多くの作業であり、b)完全な文字セットを取得するのは困難であり、確信が持てないためです。 1つか2つ欠けている場合。
私が見つけた最も簡単な方法:
var str = "üó";
var combining = /[\u0300-\u036F]/g;
console.log(str.normalize('NFKD').replace(combining, ''));
https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/String/normalize
@Pointyが言ったように、あなたの唯一のオプションは辞書に従って文字をマップ/置換することです。
JSへのiconvのポートがあります:https ://www.npmjs.com/package/iconv
var iconv = new Iconv('UTF-8', 'ASCII//TRANSLIT//IGNORE');
iconv.convert('ça va が'); // "ca va "