3

[スプリアス] BOM なしの UTF-8 としてエンコードされたファイルを編集する過程で、コンテンツに ASCII または ANSI 範囲外の Unicode 文字が含まれなくなる場合があります。次にファイルを再度開いたときに、一部のテキスト エディター (メモ帳++) は、ASCII/ANSI エンコードとして解釈し、そのように開きます。ユーザーは変更を認識せずに編集を続け、ANSI で保存されているため、レンダリングされても役に立たない非 ANSI Unicode 文字を追加します。ANSI ファイルを BOM なしの UTF-8 として開くためのメニュー オプション (Notepad++) が存在する可能性がありますが、Unicode エンコーディングで ANSI ファイルを誤ってオーバーライドするという逆の問題が発生する可能性があります。

4

3 に答える 3

2

可能であれば常にUTF-8を使用するようにエディターを構成します。そうでない場合は、エディターの作成者に文句を言います。Unicodeを対象としない文字セットは、IMOで非推奨になり、そのように扱う必要があります。

ASCIIスペース(7ビットのもの)の文字のみを使用するファイルは、とにかくUTF-8でもほとんど同じです。したがって、ASCIIエンコーディングで何かを配信する必要がある場合は、Unicode文字を入力しないでください。

于 2009-12-18T05:45:34.743 に答える
2

1 つの回避策は、ファイル内のコメントに ANSI 範囲外の文字を追加することです。デコード アルゴリズムによっては、エディタ (Notepad++) がファイルを BOM なしの UTF-8 でエンコードされているものとして認識しなければならない場合があります。

たとえば HTML ドキュメントでは、ヘッダーの文字セット定義の後に Unicode コメントを続けることができます。ここでは U+05D0 HEBREW LETTER ALEF: utf-8"> <!-- א -->

于 2009-12-17T20:56:23.617 に答える
2

ファイルが同じように見える場合、編集者が ASCII/ANSI と BOM なしの UTF-8 の違いを教えてくれるようにどのように提案しますか?

UTF-8 が UTF-8 として確実に認識されるようにするには、BOM を追加するか、ファイルに UTF-8 文字を含めるように強制します。

于 2009-12-17T20:56:24.077 に答える