0

ASCII は 8 ビット値です。Unicode は 8 ビット、16 ビット、または 32 ビットの値です。サブクラスを文字として定義した場合、WTX はそれが 8 ビット文字か 16 ビット文字かをどのように認識しますか?

4

1 に答える 1

1

アイテムのサブクラスをキャラクターに設定することは、解決策の半分にすぎません。また、言語 (デフォルトは「Western」) と、さらに重要な文字セットを設定する必要があります。UTF-8 (-16、-32) を選択すると、パーサーはマルチバイト文字を認識でき、適切に読み取ることができます (もちろん、解析されるドキュメントが型ツリーのエンコーディングでエンコードされている場合)。

于 2011-07-13T19:05:02.453 に答える