問題タブ [ucs-4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - Apache Xerces で UTF16 を UCS4 に変換
Apache Xerces: ConvertUTF16toUCS4のソース コードは次のとおりです。
UTF16 でエンコードされたサロゲート ペアを UCS4 でエンコードされたデータに変換しようとしています。WindowsOS とリトル エンディアン マシンを使用しています。
よく見ると、変換後にターゲットを に割り当てていることがわかります*targetStart
。では、ターゲットの最初の要素ではなく、ターゲットの最後の要素を指しているのではないでしょうか? *targetStart = target;
コードからステートメントを削除すると、期待どおりに機能しています。これは API のバグですか、それとも何か不足していますか?
c++ - UTF-8 ファイルを UCS-4 文字列に読み込む
UTF-8 でエンコードされたファイルを UTF-32 (UCS-4) 文字列に読み込もうとしています。基本的に、アプリケーションの内部で固定サイズの文字が必要です。
ここで、翻訳がストリーム プロセスの一部として確実に行われるようにしたいと思います (ロケールが使用されることになっているため)。文字列の翻訳を行うための別の質問が投稿されています (ただし、メモリ内で翻訳フェーズを実行する必要があり、ストリームに送信するために 2 回目のパスを実行する必要があるため、これは無駄です)。ストリーム内のロケールでそれを行うことにより、単一のパスを実行するだけでよく、コピーを作成する必要はありません (オリジナルを維持したい場合)。
これは私が試したものです。
これらはすべて標準型であるため、次のコンパイル エラーに驚きました。
以下でコンパイル:
python - pyenv を介して Python を UCS-4 としてビルドする
この問題ImportError numpy/core/multiarray.so: undefined symbol: PyUnicodeUCS2_AsASCIIStringに遭遇し、Python をpyenv-virtualenv環境にインストールしています。
私の場合、 (上記の質問のように)matplotlib
代わりにパッケージで発生しますnumpy
が、基本的に同じ問題です。
その質問で与えられた答えは簡単です:
UCS-4 としてビルドされた Python に対して NumPy を再ビルドします。
これを行う方法がわかりません。この他の質問では、次を使用する必要があると言われています。
しかし、そのコマンドをpyenvと一緒に使用する方法がわかりません。
この問題は、pyenv
リポジトリの問題リストにも記載されており、コメントに解決策が示されています。悲しいことに(私にとって)、上記のコメントで説明されている修正を適用する方法がわかりません。
したがって、私の質問は基本的に次のとおりです。PythonをUCS-4としてビルドするにはどうすればよいpyenv
ですか?