0

数学で「に属する」を表すエンコードされた文字列(おそらくUTF-16は不明)を取得する関数を作成しました。この記号は、2つのunicde文字u+f0ceとu+f020で構成されています。しかし、文字列をユーザーに表示すると、次のようになります。「」は、Unicodeの最初の部分にすぎません。プログラムは以下のとおりです。

String s = StringEscapeUtils.unescapeJava("\\uF0CE\\uF020");

上記のコードは、\ uF0CEのような単一のユニコードに対してのみ機能しますが、組み合わせることはできません。ここで私が間違っていることを見つけるのを手伝ってくれませんか?ありがとう

4

3 に答える 3

4

U+F0CEとU+F020は2つの私用文字です。Unicodeには標準的な意味はありませんが、意味が何であれ、それらは別個のものです。データを修正するか、少なくともこれらの文字がソースの意味を理解する必要があります。

于 2012-06-15T08:14:57.273 に答える
2

このページhttp://www.alanwood.net/unicode/private_use_area.htmlによると、これらのコードポイントはプライベートであり、MicrosoftのSymbolフォントでのみ定義されています。

61646F0CEシンボル

(∈のように見える)

したがって、おそらく元々Symbolフォントを使用して作成されたものから、危険なデータが提供されています。おそらく、ここhttp://www.fileformat.info/info/unicode/block/mathematical_operators/list.htmからコードポイントを最新のUnicode同等物にマップする必要があります (例:F0CE-> U + 2208)

于 2012-06-15T08:20:21.760 に答える
0

すべての助けをありがとうみんな。私はその問題の解決策を見つけました。プライベート使用の文字は、adobeによるSymbolフォントの一部です。これらのシンボルをUnicodeにマップするには、このUnicodeページにある表を使用してください。お役に立てれば。上級メンバー(ディスカッションの主題を編集するのに十分な評判を持っている)の誰かが、投稿のタイトルを「シンボルフォント(adobeによって導入された)の私的使用文字を標準のUnicodeシンボルにマップする方法」のようなものに変更できますか?それは他の誰かを助けるかもしれません。ありがとう

于 2012-06-25T11:31:32.833 に答える