1

latin1としてエンコードされたインポート用のテストファイル(csv)があります(vimレポートとして)。

websphereのfile.encodingとclient.file.encodingをUTF-8に変更しました。

これで、同じファイルがsun.io.ByteToCharUTF8.convertの「MalformedInputException」で拒否されます。

なんで?

UTF8はlatin1のスーパーセットだと思いました。したがって、一部のバイトが誤って解釈される可能性がありますが、文字セットを拡張するため、例外はありませんか?

この「MalformedInputException」の原因は他に何でしょうか。

4

1 に答える 1

2

UTF-8はASCIIのスーパーセットですが、latin-1(ASCIIの別のスーパーセット)ではありません。0〜127の範囲のすべての文字はUTF-8とASCIIで同じですが、Latin-1は128〜255の範囲の多くの文字も定義しているため、UTF-8として解釈すると問題が発生する可能性があります。

于 2012-09-10T10:33:32.007 に答える