問題タブ [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
utf-8 - C++98 で UTF-8 と UCS-2 の間の変換を行う
環境内で UTF-8 文字列を UCS-2 文字列に、またはその逆に変換するにはどうすればよいですか。
C++98
ブーストは許可されていますが、他のライブラリは許可されていません (たとえば、Microsoft やサード パーティは許可されていません)。
私はこれまでに学びました:
UTF-16 ではなく、UCS-2 が必要です。したがって、utf_to_utf()だけでは機能しません。
C++98 ではstd::codecvt_utf8は利用できません。
また利用できません: std::locale locale(" en_GB.utf8 ") (しかし、有望なアプローチ?)
これが C++98 でとても難しいとは信じられませんか?
python - pyenv を介して Python を UCS-4 としてビルドする
この問題ImportError numpy/core/multiarray.so: undefined symbol: PyUnicodeUCS2_AsASCIIStringに遭遇し、Python をpyenv-virtualenv環境にインストールしています。
私の場合、 (上記の質問のように)matplotlib
代わりにパッケージで発生しますnumpy
が、基本的に同じ問題です。
その質問で与えられた答えは簡単です:
UCS-4 としてビルドされた Python に対して NumPy を再ビルドします。
これを行う方法がわかりません。この他の質問では、次を使用する必要があると言われています。
しかし、そのコマンドをpyenvと一緒に使用する方法がわかりません。
この問題は、pyenv
リポジトリの問題リストにも記載されており、コメントに解決策が示されています。悲しいことに(私にとって)、上記のコメントで説明されている修正を適用する方法がわかりません。
したがって、私の質問は基本的に次のとおりです。PythonをUCS-4としてビルドするにはどうすればよいpyenv
ですか?
unicode - パシュトー語の ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ې の文脈上の形式の Unicode
たとえば、テキストの正しい形式を提供するプログラムを開発しています。たとえば、 を書いた場合、魔女はـ, ـلـ , ﺎ , ـمのUnicode になります。Initial Contextual formである文字ټـの Unicode ではありません。FEB3, FEE0, FE8E and FEE2
067C
そのため、Wikipediaで ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ېの分離の Unicodeを見つけましたが、コンテキスト形式のUnicodeは見つかりません。
たとえば、 ټـ 、ـټـ、ـټのUnicodeです。
この問題の解決策を知っている人がいる場合は、応答を待っています。ありがとう...