1

iso-8859-1 のファイル エンコードを UNICODE に変換する簡単なタスクを実行したいと考えています。docs.oracle.comの Java 仕様によると

プロパティ キーまたは値の \u0020 未満の文字および \u007E より大きい文字は、適切な 16 進値 xxxx の \uxxxx として書き込まれます。

インターネットを見ると、native2ascii はかなり古く、問題があるようですが、翻訳ツールキット(および po2prop) ははるかに優れています。

"à" のような文字を含むファイルを \00e0 (http://www.fileformat.info/info/unicode/char/00e0/index.htm) に変換するにはどうすればよいですか?

私はこれをかなり長い間見てきましたが、適切な答えを見つけることができませんでした。

4

2 に答える 2

1

これがあなたが探しているものであるかどうかはわかりませんが、ユーティリティでさまざまな入力テキストストリームタイプ(UTF-8およびISO 8859-1を含む)およびさまざまな出力テキストストリームタイプ(UTF-16を含む)をどのように処理したかを確認できcrlfますしばらく前に書きました。\uddddプログラムには、制御文字を文字シーケンスとして変換するオプションがあります。

それは次の場所にあります:http:
//david.tribble.com/src/crlf.cpp
http://david.tribble.com/src/src.html

JavaではなくC++で記述されていることに注意してください。

于 2012-04-26T23:35:57.360 に答える
0

迅速で汚いハックとして、文字列をJSONとしてエンコードし、終了引用符を取り除くことができます。ただし、他の通常のJSONのようなプロパティがどのようにエスケープされるかはよくわかりません...

于 2012-04-26T22:34:39.970 に答える