曲の詳細が意味不明な中国語になると、この問題が発生します。例えば:
トランスルーセントは僩儔儞僗儖乕僙儞僩になります</p>
これは通常、ダウンロードした曲に発生します。ユニコードを分析したところ、約 8k で異なるようです。Unicode の変更とは何ですか? 私の友人は同じファイルを問題なくダウンロードしました。
曲の詳細が意味不明な中国語になると、この問題が発生します。例えば:
トランスルーセントは僩儔儞僗儖乕僙儞僩になります</p>
これは通常、ダウンロードした曲に発生します。ユニコードを分析したところ、約 8k で異なるようです。Unicode の変更とは何ですか? 私の友人は同じファイルを問題なくダウンロードしました。
バイトのシーケンス:
83 67 83 89 83 93 83 58 83 8b 81 5b 83 5a 83 93 83 67
Shift-JIS エンコーディング (Windows の場合、コード ページ 932) を使用して「トランスルーセント」として解釈するか、GB エンコーディング (Windows の場合、コード ページ 936) を使用して「僩儔儞僗儖乕僙儞僩」として解釈できます。Windows マシンがそのような一連のバイトに遭遇した場合、どのエンコーディングが使用されているかを通知するシグナルがない場合、「デフォルトのコード ページ」が選択されます。これは、コントロール パネルの地域オプションの「非 Unicode の言語」の設定に依存します。アプリケーション」フィールド。日本語に設定すると「トランスルーセント」、中国語に設定すると「僩儔儞僗儖乕僙儞僩」、西欧に設定すると「ƒgƒ‰ƒ“ƒXƒ‹�[ƒZƒ"ƒg」(古典的な文字化け)が表示されます。
アプリケーションの作成者としてこれを回避するには、Unicode 文字列と、UTF-8 や UTF-16 などの Unicode セーフ エンコーディングを使用してデータを保存する必要があります。エンド ユーザーとしてこれが発生しないようにするには、Unicode をサポートするアプリケーションとフォーマットを使用する必要があります。もちろん、ランダムな MP3 をダウンロードしている場合は、それをエンコードしたアプリケーションが何をしたかについて多くを語ることはできず、我慢する必要があります。
質問で説明している正確な一連のイベントと、比較しているものの違いが明確ではありません。MP3 ファイルを比較する場合、非常に反社会的なメディア プレーヤー アプリケーションの中には、ファイルを再生するときに ID3 タグに書き込むことを決定するものがあることに注意してください。