私は現在Javaでプログラムを開発しており、遠くのWebサイトから取得した中国語のピンインを表示したいと考えています。
しかし、次の問題があります: 中国語のピンインは次のようjiǎ
に表示され
ます。
この質問に対する答えは本当に簡単だと思いますが、見つけるのに苦労しています。
問題は、HTML でエンコードされた Unicode 文字があり、必要なのはそのデコードされたバージョンであることです。commons-lang3 (Apache Commons の一部) のようなライブラリは、HTML でエンコードされた文字列を取得し、Java 用にデコードして次のように表示します。
String decoded = StringEscapeUtils.unescapeHtml("jiǎ");
次のように、Java で Unicode 文字をエスケープすることもできます。
String jia = "ji\u01ce";
この巧妙なワンライナーは、Unicode 文字を取得し、そのエスケープ形式を示します。
System.out.println( "\\u" + Integer.toHexString('ǎ' | 0x10000).substring(1) );