次の Java コードがあります。
String str = "\u00A0";
byte[] bytes = str.getBytes(StandardCharsets.UTF_8);
System.out.println(Arrays.toString(bytes));
これにより、次のバイト配列が出力されます。
[-62, -96]
Javascriptで同じ結果を得ようとしています。ここに投稿されたソリューションを試しました:
https://stackoverflow.com/a/51904484/12177456
function strToUtf8Bytes(str) {
const utf8 = [];
for (let ii = 0; ii < str.length; ii++) {
let charCode = str.charCodeAt(ii);
if (charCode < 0x80) utf8.push(charCode);
else if (charCode < 0x800) {
utf8.push(0xc0 | (charCode >> 6), 0x80 | (charCode & 0x3f));
} else if (charCode < 0xd800 || charCode >= 0xe000) {
utf8.push(0xe0 | (charCode >> 12), 0x80 | ((charCode >> 6) & 0x3f), 0x80 | (charCode & 0x3f));
} else {
ii++;
// Surrogate pair:
// UTF-16 encodes 0x10000-0x10FFFF by subtracting 0x10000 and
// splitting the 20 bits of 0x0-0xFFFFF into two halves
charCode = 0x10000 + (((charCode & 0x3ff) << 10) | (str.charCodeAt(ii) & 0x3ff));
utf8.push(
0xf0 | (charCode >> 18),
0x80 | ((charCode >> 12) & 0x3f),
0x80 | ((charCode >> 6) & 0x3f),
0x80 | (charCode & 0x3f),
);
}
}
return utf8;
}
console.log(strToUtf8Bytes("h\u00A0i"));
しかし、これはこれを提供します(これはhttps://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Uint8Arrayです):
[194, 160]
私はgraal jsエンジンを使用しており、配列を期待するJava関数に配列を渡す必要があるため、これは私にとって問題ですbyte[]
。
https://github.com/oracle/graal/issues/2118
ここで説明されているように、関数TextEncoder
の代わりにクラスも試したことに注意してください。strToUtf8Bytes
java string.getBytes("UTF-8") 同等の JavaScript
しかし、それは上記と同じ結果をもたらします。
JavaScript で Java と同じ配列を生成できるようにするために、ここで他に試すことができるものはありますか?