python - ファイルの最初の行に含まれる Unicode ヘッダー

Question

ファイルから最初の行を印刷しています：

with open(path,"r",encoding='utf8') as f:
    for i, l in enumerate(f.readlines()):
        print(bytes(l.rstrip(), encoding='utf8'))

b'1' を出力することを期待していますが、代わりに次のようになっています。

b'\xef\xbb\xbf1'

ここで何が問題なのですか？

私はWindowsを使用しており、メモ帳++を使用してファイルを保存しました。

score 6 · Accepted Answer

BOM を正しく解析するには、utf-8-sigを使用します。

with open(path,"r",encoding='utf-8-sig') as f:

score 2 · Accepted Answer

Notepad++ が UTF-8 エンコードとしてマークするためにファイルの先頭に配置したバイトオーダーマーク (BOM)が表示されています。

score 1 · Accepted Answer

BOMの UTF-8 表現はバイトシーケンス0xEF,0xBB,0xBFです。テキストを ISO-8859-1 または CP1252 として解釈するテキストエディターまたは Web ブラウザーは、このために文字 ï»¿ を表示します。

BOM インUTF-8は必要ありません。Notepad++ を構成できます。

3 に答える 3