xml - 珍しいオクテットオーダー BOM とは

翻译自：https://stackoverflow.com/questions/18518730 2013-08-29T18:42:52.150

383 次

XML ドキュメントおよび Mozilla Universal Character Set Detector (UCSD) のさまざまな実装では、バイト順または語順のいずれかが逆になっている BOM シーケンスが表示されますが、両方ではなく、「異常なオクテット順」と呼ばれています。 :

XML ドキュメント:

F.1 Detection Without External Encoding Information
...
00 00 FF FE     UCS-4, unusual octet order (2143)
FE FF 00 00     UCS-4, unusual octet order (3412)

Universal Character Set Detector (UCSD) ソース(ほんの一例):

  if (('\xFF' == aBuf[1]) && ('\x00' == aBuf[2]) && ('\x00' == aBuf[3]))
    // FE FF 00 00 UCS-4, unusual octet order BOM (3412)
    mDetectedCharset = "X-ISO-10646-UCS-4-3412";

  else if (('\x00' == aBuf[1]) && ('\xFF' == aBuf[2]) && ('\xFE' == aBuf[3]))
    // 00 00 FF FE UCS-4, unusual octet order BOM (2143)
    mDetectedCharset = "X-ISO-10646-UCS-4-2143";

Universal Character Set Detector (UCSD) ドキュメント:

Known character sets
...
X-ISO-10646-UCS-4-2143
X-ISO-10646-UCS-4-3412

このエンディアンを使用するハードウェアは存在しますか?そのようなエンコーディングまたは ISO 標準はありますか?これをエンコード/デコードする一般的なライブラリはありますか? これらのシーケンスが他の無効なシーケンスのように無視されないのはなぜですか?

xml - 珍しいオクテット オーダー BOM とは

1 に答える 1

Related

Reference

xml - 珍しいオクテットオーダー BOM とは