問題タブ [ucs]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++ コードでの UTF の使用
UTF と UCS の違いは何ですか。
C++ 文字列で (UTF を使用して) ヨーロッパ以外の文字セットを表す最良の方法は何ですか。あなたの推奨事項を知りたい:
- コード内の内部表現
- 実行時の文字列操作用
- 文字列を表示目的で使用するため。
- 最適なストレージ表現 (つまり、ファイル内)
- 最適なオン ワイヤ トランスポート形式 (異なるアーキテクチャ上にあり、異なる標準ロケールを持つアプリケーション間の転送)
.net - System.Speech.Recognition と Microsoft.Speech.Recognition の違いは何ですか?
.NET の音声認識には、2 つの類似した名前空間とアセンブリがあります。違いと、どちらを使用するのが適切なのかを理解しようとしています。
アセンブリ System.Speech (System.Speech.dll 内) から System.Speech.Recognition があります。System.Speech.dll は、.NET Framework クラス ライブラリ 3.0 以降のコア DLL です。
アセンブリ Microsoft.Speech (microsoft.speech.dll 内) からの Microsoft.Speech.Recognition もあります。Microsoft.Speech.dll は UCMA 2.0 SDK の一部です
ドキュメントがわかりにくく、次の質問があります。
System.Speech.Recognition は「Windows Desktop Speech Technology」用であると言っていますが、これはサーバー OS では使用できない、または大規模なアプリケーションには使用できないということですか?
UCMA 2.0 Speech SDK ( http://msdn.microsoft.com/en-us/library/dd266409%28v=office.13%29.aspx ) には、前提条件として Microsoft Office Communications Server 2007 R2 が必要であると記載されています。ただし、カンファレンスや会議で、プレゼンスやワークフローなどの OCS 機能が必要ない場合は、OCS なしで UCMA 2.0 Speech API を使用できると言われました。これは本当ですか?
サーバー アプリケーション用の単純な認識アプリを構築しており (たとえば、ボイス メールを自動的に文字起こししたいと考えていました)、OCS の機能は必要ありません。2 つの API の違いは何ですか?
utf-8 - 英語以外の文字に関して、RFC 3986 で「大文字と小文字を区別しない」とはどういう意味ですか?
RFC 3986 は、URI のホスト コンポーネントが「大文字と小文字を区別しない」ことを指定しています。ただし、UCS または UTF-8 文字に関して「大文字と小文字を区別しない」が何を意味するかは指定されていません。
RFC に示されている例 (例: " <HTTP://www.EXAMPLE.com/
> is equal to <http://www.example.com/
>") から、「大文字と小文字を区別しない」ということは、少なくとも文字 A ~ Z が UTF-8 文字セットの文字 32 の前にある文字と同等であると見なされることを意味すると推測できます。つまり、 AZ。ただし、この範囲外の文字をどのように扱うべきかについては言及されていません。したがって、www.OLÉ.comというエンコードも正規化もされていない登録名が与えられた場合、RFC で許容される正規化の 3 つの形式が考えられます。
- 小文字でwww.olé.comに変換し、パーセント エンコードして www.ol%E9.com に変換します
- www.olÉ.comには A ~ Z 文字のみを小文字にしてから、www.ol%C9.com にパーセント エンコードします。
- パーセントで www.OL%C9.com にエンコードしてから、パーセントでエンコードされていない部分を小文字で www.ol%C9.com にすると、2 と同じ結果になります。
質問は次のとおりです。どちらが正しいですか。ケース 1 の場合、どの文字が大文字と見なされ、どの文字が小文字と見なされるか (また、どの文字に大文字と小文字がないか) を定義するものは何ですか?
unicode - UCS と Unicode の両方の文字セットが必要なのはなぜですか?
UCS と Unicode のコードポイントは同じだと思いますよね?
その場合、なぜ 2 つの標準 (UCS と Unicode) が必要なのでしょうか?
linux - Numpy には ucs2 が必要です
ActivePython を使用して Numpy をインストールしましたが、numpy モジュールをインポートしようとすると、次のエラーがスローされます。
ImportError: /opt/ActivePython-2.7/lib/python2.7/site-packages/numpy/core/multiarray.so: 未定義のシンボル: PyUnicodeUCS2_FromUnicode
私はPythonにかなり慣れていないので、何をすべきかわかりません。正しい方向に向けていただければ幸いです。
- Python を削除し、「--enable-unicode=ucs2」または「--with-wide-unicode」オプションを使用してコンパイルを構成する必要がありますか?
乾杯
- OS: フェドラ 16、64 ビット;
- Python バージョン: Python 2.7.2 (デフォルト、2012 年 3 月 26 日 10:29:24);
- 現在のコンパイル Unicode バージョン: ucs4
c++ - c++: 任意のファイルを std::string に読み込む方法
たくさんの txt ファイルがあり、それらを std::string に読み込みたいのですが、そのうちのいくつかは UCS-2、UTF-8 でエンコードされています。それらを std::string に読み込む方法。テキストファイルを std::string に読み込みたいだけです。それらを変換する必要がありますか?
linux - ucs4 の問題で numpy をビルドする
ucs4形式でpython2.7を正常にインストールしました。
numpy を sudo pip install --upgrade numpy でインストールすると動作し、使用できますが、この方法でインストールしても numpy は dist-packages にしか入れられませんが、site-packages に入れる必要があります。(Jepp はそこでしか見つけられないため)
したがって、numpy tar ファイルをダウンロードし、ビルド (sudo python setup.py build) してインストール (sudo python setup.py install) しましたが、未定義のシンボル PyUnicodeUCS2_FromUnicode が表示されます。私には思えますが、ucs2でnumpyをインストールしました。
ucs4 で numpy を強制的にインストールするにはどうすればよいですか? (私はこの記事を読みました: Numpy needs the ucs2 but EPD is not the solution for me)
どんなアイデアでも私を助けるかもしれません!前もって感謝します。