GB3212 でエンコードされた 2 つの中国語 "果然有问题" があります。ただし、ANSI に誤ってエンコードされ、「彆衄恀枙」になります。16 進エディタでは、B9FBC8BBD3D0CECACCE2 です。
Javaを使用して文字セットを修正し、UTF-16に保存したいと思います。
だから、私はしようとします:
String wrongstr = "彆衄恀枙";
byte[] binary = wrongstr.getBytes("BIG5");
System.out.printf("%s", new String(binary, "GB2312"));
しかし、私が得たものは: 果?有问题</p>
Notepad++ を使用したところ、正しい単語が表示されました。getBytes("BIG5") または getBytes("US_ANSI") または r.getBytes("GB2312") を使用して正しい 16 進数を取得できません (B9FBC8BBD3D0CECACCE2)
何が悪いのかわからない。助けてください、事前に感謝します。