Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ASCII は 8 ビット値です。Unicode は 8 ビット、16 ビット、または 32 ビットの値です。サブクラスを文字として定義した場合、WTX はそれが 8 ビット文字か 16 ビット文字かをどのように認識しますか?
アイテムのサブクラスをキャラクターに設定することは、解決策の半分にすぎません。また、言語 (デフォルトは「Western」) と、さらに重要な文字セットを設定する必要があります。UTF-8 (-16、-32) を選択すると、パーサーはマルチバイト文字を認識でき、適切に読み取ることができます (もちろん、解析されるドキュメントが型ツリーのエンコーディングでエンコードされている場合)。