問題タブ [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
45 参照

mysql - 扱っているファイルの種類と、これを MySQL テーブルにロードする方法を教えてください。

このファイルを FTP サーバーからダウンロードしています。VIM で開くと、次のようになります。

ここに画像の説明を入力

ここに画像の説明を入力

これを Notepad++ で開くと、次のように表示されます (正常に見えます)。

ここに画像の説明を入力

だから私はこのファイルがどのエンコーディングに入っているかを見ようとしました、そしてそれが入っているのを見ました

ここに画像の説明を入力

問題は、FTP からファイルをダウンロードした後、このファイルを一時テーブルにロードする必要があることです。これをutf8のテーブルに安全にロードするにはどうすればよいですか?

MySQL テーブルにインポートすると、次のように文字間にスペースが入ります。

ここに画像の説明を入力

0 投票する
1 に答える
2234 参照

utf-8 - C++98 で UTF-8 と UCS-2 の間の変換を行う

環境内で UTF-8 文字列を UCS-2 文字列に、またはその逆に変換するにはどうすればよいですか。

  • C++98

  • ブーストは許可されていますが、他のライブラリは許可されていません (たとえば、Microsoft やサード パーティは許可されていません)。

私はこれまでに学びました:

  • UTF-16 ではなく、UCS-2 が必要です。したがって、utf_to_utf()だけでは機能しません。

  • C++98 ではstd::codecvt_utf8は利用できません。

  • また利用できません: std::locale locale(" en_GB.utf8 ") (しかし、有望なアプローチ?)

これが C++98 でとても難しいとは信じられませんか?

0 投票する
1 に答える
1470 参照

python - pyenv を介して Python を UCS-4 としてビルドする

この問題ImportError numpy/core/multiarray.so: undefined symbol: PyUnicodeUCS2_AsASCIIStringに遭遇し、Python をpyenv-virtualenv環境にインストールしています。

私の場合、 (上記の質問のように)matplotlib代わりにパッケージで発生しますnumpyが、基本的に同じ問題です。

その質問で与えられた答えは簡単です:

UCS-4 としてビルドされた Python に対して NumPy を再ビルドします。

これを行う方法がわかりません。この他の質問では、次を使用する必要があると言われています。

しかし、そのコマンドをpyenvと一緒に使用する方法がわかりません。

この問題は、pyenvリポジトリの問題リストにも記載されており、コメントに解決策が示されています。悲しいことに(私にとって)、上記のコメントで説明されている修正を適用する方法がわかりません。

したがって、私の質問は基本的に次のとおりです。PythonをUCS-4としてビルドするにはどうすればよいpyenvですか?

0 投票する
2 に答える
775 参照

unicode - パシュトー語の ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ې の文脈上の形式の Unicode

たとえば、テキストの正しい形式を提供するプログラムを開発しています。たとえば、 を書いた場合、魔女はـ, ـلـ , , ـمのUnicode になりますInitial Contextual formである文字ټـの Unicode ではありません。FEB3, FEE0, FE8E and FEE2067C

そのため、Wikipediaで ټ,ګ,ځ,څ,ڼ,ښ,ډ,ۍ,ړ,ېの分離の Unicodeを見つけましたが、コンテキスト形式のUnicodeは見つかりません。

たとえば、 ټـ 、ـټـ、ـټのUnicodeです。

この問題の解決策を知っている人がいる場合は、応答を待っています。ありがとう...