私はサードパーティの API / Web サービスを扱っていますが、XML では latin-1 文字セットのみが許可されています。文字列内のすべてのラテン語以外の文字を見つけて置き換える既存の API / メソッドはありますか?
例: ケビン
とにかくそのケビンを作ることはありますか?
ICU4Jを使って、
public String removeAccents(String text) {
return Normalizer.decompose(text, false, 0)
.replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}
この例はhttp://glaforge.appspot.com/article/how-to-remove-accents-from-a-stringで見つけました
Java 1.6 では、必要なノーマライザーが組み込まれている場合があります。