0

Windowsは、uniscribeライブラリを使用して、場所に基づいてアラビア語とインディタイプの文字を置き換えます。新しいグリフには、入力された文字の元のユニコードが残っていますが、Unicodeで専用の表現があります。入力されたものではなく、実際に表示されたもののUnicodeを取得する方法。

4

2 に答える 2

0

ICU、Charmapなどのツールはたくさんあります。私自身、http://unicode.codeplex.comをお勧めします。これは、 Unicode文字データベースを使用して文字を表します。

ユニコードは文字に関する単なる情報であり、表現については決して話さないことに注意してください。彼らは、彼らの例のように単語を実装することを提案しているだけです。そのため、各コードを表示するには、Windowsプラットフォームで最大かつ最高の選択肢であるMSArialUnicodeのようStandard Unicode Fontに必要です。

ほとんどの文字はこのフォントで実装されていますが、新しい文字の場合は更新が必要です(そのような更新がある場合)、または希望の文字が実装されていることがわかっているフォントを使用できます

于 2011-05-25T10:34:32.293 に答える
0

Uniscribe で何が起こっているかについてのあなたの解釈は正しくありません。グリフを取得すると、元の情報が失われ、Unicode に戻る確実な方法はありません。

アラビア語に行かなくても、(たとえば) fi 合字のグリフが 'f' と 'i' (U+0066 U+0069) に由来するのか、それとも 'fi' (U+FB01) に由来するのかを区別する方法はありません。 . ( http://www.fileformat.info/info/unicode/char/fb01/index.htm )

また、結果のグリフの一部には関連付けられた Unicode 値がないため、「実際に表示されるものの Unicode」はありません。

于 2011-05-28T09:52:55.600 に答える