UFT8、UTF16、UTF32ですか?それはとても重要です!テキストを昔ながらの ASCII (すべての文字が 1 バイト長) に変換したいとします。
UTF8 は、標準の ASCII 文字に 1 バイトを使用し、特殊/多言語文字 (文字コード > 127) にのみ複数バイトを使用するため、既に (少なくともほとんど) 読み取り可能である必要があります。あなたのファイルは UTF8 ではないか、すでに読めるようです! オンライン コンテンツは通常 UTF-8 です。
Unicode 文字コードは、127 までの古い ASCII コードと同じです。
UTF16 と UTF32 は、文字を 1 バイトで表現できるかどうかにかかわらず、すべての文字をエンコードするために常にそれぞれ 2 バイトと 4 バイトを使用します。これにより、テキスト エディターが UTF8 を想定している場合、読み取り不能になります。
Gedit は UTF16 と UTF32 をサポートしていますが、開いているダイアログ ボックスでこれらのエンコーディングを明示的に「追加」する必要があります (自動検出を使用する代わりに明示的に選択することもできます)。