java - latin1からUTF8へのエンコードが失敗する

Question

latin1としてエンコードされたインポート用のテストファイル（csv）があります（vimレポートとして）。

websphereのfile.encodingとclient.file.encodingをUTF-8に変更しました。

これで、同じファイルがsun.io.ByteToCharUTF8.convertの「MalformedInputException」で拒否されます。

なんで？

UTF8はlatin1のスーパーセットだと思いました。したがって、一部のバイトが誤って解釈される可能性がありますが、文字セットを拡張するため、例外はありませんか？

この「MalformedInputException」の原因は他に何でしょうか。

score 2 · Accepted Answer

UTF-8はASCIIのスーパーセットですが、latin-1（ASCIIの別のスーパーセット）ではありません。0〜127の範囲のすべての文字はUTF-8とASCIIで同じですが、Latin-1は128〜255の範囲の多くの文字も定義しているため、UTF-8として解釈すると問題が発生する可能性があります。

java - latin1からUTF8へのエンコードが失敗する

1 に答える 1

Related

Reference