XML ドキュメントおよび Mozilla Universal Character Set Detector (UCSD) のさまざまな実装では、バイト順または語順のいずれかが逆になっている BOM シーケンスが表示されますが、両方ではなく、「異常なオクテット順」と呼ばれています。 :
F.1 Detection Without External Encoding Information
...
00 00 FF FE UCS-4, unusual octet order (2143)
FE FF 00 00 UCS-4, unusual octet order (3412)
Universal Character Set Detector (UCSD) ソース(ほんの一例):
if (('\xFF' == aBuf[1]) && ('\x00' == aBuf[2]) && ('\x00' == aBuf[3]))
// FE FF 00 00 UCS-4, unusual octet order BOM (3412)
mDetectedCharset = "X-ISO-10646-UCS-4-3412";
else if (('\x00' == aBuf[1]) && ('\xFF' == aBuf[2]) && ('\xFE' == aBuf[3]))
// 00 00 FF FE UCS-4, unusual octet order BOM (2143)
mDetectedCharset = "X-ISO-10646-UCS-4-2143";
Universal Character Set Detector (UCSD) ドキュメント:
Known character sets
...
X-ISO-10646-UCS-4-2143
X-ISO-10646-UCS-4-3412
このエンディアンを使用するハードウェアは存在しますか?そのようなエンコーディングまたは ISO 標準はありますか?これをエンコード/デコードする一般的なライブラリはありますか? これらのシーケンスが他の無効なシーケンスのように無視されないのはなぜですか?