0
4

2 に答える 2

2

ファイルが JIS-X-0208(EUC-JP) でエンコードされているかどうかを判断するためのその他の制限はありますか?

先頭バイト 0xF5 ~ 0xF8 と 0xFD ~ 0xFE が割り当てられていないという点で少し、ブロック全体の最後にいくつかの割り当てられていない文字が散りばめられています。

ただし、バイト シーケンス C3DCC2EBD3C3BBA7C3FBC3DCC2EBC3FBB3C6C3FBB3C6 は GB (密码用户名密码名称名称) と EUC-JP (畜鷹喘薩兆畜鷹兆各兆各) で等しく有効であるため、ここでは役に立ちません。

これが、文字セット スニッフィングの喜びです。入力に存在する可能性に基づいて、持っている文字セットを整理して並べ替える必要があります。通常、Windows の世界では EUC-JP はまれであり (Shift-JIS に類似したコード ページ 932 が代わりに使用されます)、通常は GB に類似したコード ページ 936 が「勝ち」ます。

于 2015-10-06T09:18:26.770 に答える