UTF16-LE と UTF-32LE で使用されるバイト オーダー マークにはあいまいさがあるようです。特に、次の 8 バイトを含むファイルを考えてみましょう。
FF FE 00 00 00 00 00 00
このファイルに次のものが含まれているかどうかを確認するにはどうすればよいですか。
- UTF16-LE BOM (FF FE) の後に 3 つのヌル文字が続きます。また
- UTF32-LE BOM (FF FE 00 00) の後に 1 つのヌル文字が続く?
Unicode BOM はhttp://unicode.org/faq/utf_bom.html#bom4で説明されていますが、このあいまいさについての議論はありません。何か不足していますか?