2

たとえば、UTF-8固有の句読点をすべて失うことなく、JavaでUTF-8からISO-8859-1への文字変換を実行する必要があります。
理想的には、これらを ISO で同等のものに変換したいと考えています (たとえば、UTF-8 にはおそらく 5 つの異なる単一引用符があり、それらすべてを ISO 単一引用符文字に変換したいと考えています)。

String.getBytes("ISO-8859-1") は、UTF-8 固有の文字が失われるため、この場合はうまくいきません。

UTF-8 固有の文字を ISO にマップする Java の準備済みのマッピングまたはライブラリを知っていますか?

4

3 に答える 3

2

IBM のICUプロジェクトは、あなたが探しているものかもしれません。フォールバック変換をサポートしています。

于 2010-03-02T13:18:56.380 に答える
1

ISO-8859-1 の明示的な文字セットで OutputStream を使用することを検討しましたか?

次に、Unicode 文字を書き込んで、何が得られるかを確認してください。

于 2010-03-02T12:18:09.817 に答える
0

Java Development Kit には、これを行う native2ascii というツールがあります。使用する:

native2ascii -encoding UTF-8 [ inputfile [ outputfile ] ]

-reverse オプションを使用して逆方向に戻ることもできます。

JDK 1.6 でサポートされているエンコーディングのリストも参照してください。

于 2010-05-29T12:13:43.300 に答える