iso-8859 はラテン文字をサポートしていますか? Java プログラムで iso-8859-1 を使用して漢字でファイルを読み取る必要がありますか?これの違いは何ですか?
2 に答える
ISO-8859 は、8 ビット文字エンコーディングの標準です。8 ビットでは 256 の組み合わせが得られますが、これはほとんどのラテン アルファベットの拡張では問題ありませんが、中国語の文字では問題ありません。
ISO-8859-1 は、ほとんどの西ヨーロッパ言語 (フランス語、ドイツ語、スペイン語など) をサポートする ISO-8859 の「バージョン」の 1 つです。中央ヨーロッパ言語 (ポーランド語、チェコ語、スロバキア語など) の場合は、ISO-8859-2 などが必要です。
ISO-8859-1 と ISO-8859-2 の相違点の 1 つは、ISO-8859-1 のフランス語の文字è
であり、ISO-8859-2 のチェコ語/スロバキア語の文字と同じ位置にありč
ます。そのため、この 2 つの文字を 1 つのテキストにまとめることができませんでした。
Unicode を使用すると、漢字も組み合わせることができます。
中国語にはいくつかのエンコーディングが利用できます (簡体字と繁体字など)。リストについては、 http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.htmlを参照
してください。最も一般的なものは、簡体字中国語と繁体字中国語のGB2312
別名です。で表された中国語の文書も見たことがあります。EUC_CN
Big5
UTF-8