5

iso-8859 はラテン文字をサポートしていますか? Java プログラムで iso-8859-1 を使用して漢字でファイルを読み取る必要がありますか?これの違いは何ですか?

4

2 に答える 2

13

ISO-8859 は、8 ビット文字エンコーディングの標準です。8 ビットでは 256 の組み合わせが得られますが、これはほとんどのラテン アルファベットの拡張では問題ありませんが、中国語の文字では問題ありません。

ISO-8859-1 は、ほとんどの西ヨーロッパ言語 (フランス語、ドイツ語、スペイン語など) をサポートする ISO-8859 の「バージョン」の 1 つです。中央ヨーロッパ言語 (ポーランド語、チェコ語、スロバキア語など) の場合は、ISO-8859-2 などが必要です。

ISO-8859-1 と ISO-8859-2 の相違点の 1 つは、ISO-8859-1 のフランス語の文字èであり、ISO-8859-2 のチェコ語/スロバキア語の文字と同じ位置にありčます。そのため、この 2 つの文字を 1 つのテキストにまとめることができませんでした。

Unicode を使用すると、漢字も組み合わせることができます。

于 2011-01-17T09:14:14.817 に答える
0

中国語にはいくつかのエンコーディングが利用できます (簡体字と繁体字など)。リストについては、 http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.htmlを参照 してください。最も一般的なものは、簡体字中国語と繁体字中国語のGB2312別名です。で表された中国語の文書も見たことがあります。EUC_CNBig5UTF-8

于 2011-01-17T10:19:04.110 に答える