0

「\u2012」のような特別な文字を含む文字列があります。つまり、FIGURE DASH です。これをコンソールに印刷しようとすると、「?」が表示されます。そのシンボルの代わりにマーク。alt+2012 のように alt+numpad を使用して記号を挿入できるエディタがあります。エディターでは、シンボルがそれを xml ファイルに保存し、nodevalue を使用して値を取得するのを見ることができました。マーク。
要約すると、拡張ラテン文字セットを読み取る問題に直面しています。必要なのは、そのような記号を挿入して読み取ると、 &#xXXXX; のようなものが得られるはずです。助けてください!

ティア:)

単純に文字列 inpath = "À"; を持っているので、その Unicode 値を取得したい.. &#xXXXX; のように

4

1 に答える 1

0

Windows のデフォルトのコンソール エンコーディングは、一部の MS-DOS コード ページであり、文字をサポートしていません。プログラムを実行する前に実行を試すことができchcp 65001ますが、コンソールのフォントも変更する必要がある場合があります。

UTF-8 を使用している限り、他の文字ではできないことをする必要はありません。あなたは多くの場所でそれをしていません。UTF-8 でファイルを保存して読み取るには、コードを明示的に記述する必要があり、プラットフォームの既定のエンコーディングには依存しません。

于 2013-01-18T05:46:52.450 に答える