BOMがUTF-8ファイルに使用されていることは知っていますが、すべての文字が2バイトであるテキストファイルについても、バイト順マークを追加する必要がありますか?
1 に答える
5
BOMはUCS-2とUTF-16用に発明され、その後Microsoft(そしてXML)によってUTF-8に割り当てられました。名前について考えてみてください:「バイト順マーク」。UTF-8には可能なバイト順序が1つしかないため、順序を明らかにするためにBOMは必要ありません。代わりに、UTF-8のU + FEFFの3バイトシーケンスは、ファイルタイプスニッフィングのUnicodeシグネチャになりました。
ただし、JavaでのXMLサポートの初期バージョンは、XML標準にUTF-8 BOMが含まれているにもかかわらず、UTF-8BOMに適切に応答しませんでした。さらに、U + FEFFはファイルの途中にあるBOMではないため、BOMを含むファイルを別のファイルに単純に連結することはできません。それはZWNBSPです。
于 2012-10-08T14:52:19.297 に答える