24

テキストファイルを「Unicode」としてメモ帳に保存するとはどういう意味ですか?Utf-8、Utf-16、またはUtf-32ですか?前もって感謝します。

4

2 に答える 2

34

メモ帳では、一般的なWindowsソフトウェアと同様に、エンコード名としての「Unicode」はUTF-16リトルエンディアン(UTF-16LE)を意味します。(メモ帳++はUCS-2として認識し、コンテンツをガベージとして表示するため、最初は実際のUTF-16ではないと思いましたが、BabelPadで再確認したところ、メモ帳は非BMP文字でも正しくエンコードできると結論付けました。)

同様に、「Unicodeビッグエンディアン」はUTF-16ビッグエンディアンを意味します。また、「ANSI」とは、システムのネイティブレガシーエンコーディングを意味します。たとえば、8ビットWindows-Windowsの欧米バージョンでの1252エンコーディングです。

于 2012-12-15T18:40:54.427 に答える
-4

All of these formats are "Unicode". But usually editors on Mac and Windows mean UTF-8 with that because it is ASCII compatible below code 128 IIRC. UTF-8 can represent more codes than just 256 (which fits in a single byte of 8 bits) by using a special character which means that the following byte also belongs to the same character.

If you look at the output in terminal, say with vi, and if you see a space between every two characters then you are looking at UTF-16 because there every two bytes make up one character. What you should see is that the characters don't have spaces between them, that's an indication for UTF-8.

于 2012-12-15T18:27:43.790 に答える