問題タブ [unicode-string]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - UTF-8文字*からCStringへの変換
UTF-8 char *の文字列をCStringに変換するにはどうすればよいですか?
c - C:UTF-8文字列からUTF-16文字列に必要なバイト数を決定する最も効率的な方法
UnicodeコードポイントとUTF-8の間で変換するための非常に巧妙なコードを見たことがあるので、誰かがこれを持っている(または考案するのを楽しむ)かどうか疑問に思いました。
- UTF-8文字列が与えられた場合、同じ文字列のUTF-16エンコーディングに必要なバイト数。
- UTF-8文字列がすでに検証されていると仮定します。BOMがなく、長すぎるシーケンスや無効なシーケンスがなく、nullで終了します。CESU-8ではありません。
- サロゲートを含む完全なUTF-16をサポートする必要があります。
具体的には、UTF-8シーケンスをコードポイントに完全に変換せずに、サロゲートペアがいつ必要になるかを知るための近道があるのではないかと思います。
私が見た中で最高のUTF-8からコードポイントへのコードはベクトル化手法を使用しているので、ここでもそれが可能かどうか疑問に思います。
c++ - MSVC ++のユニコード設定に従って、std::stringとstd::wstringの間で自動的に変更しますか?
私は DLL を作成しており、MSVC++2010 でユニコードとマルチバイトの設定を切り替えられるようにしたいと考えています。たとえば、-W および -A バージョンなどの代わりに_T("string")
and LPCTSTR
andを使用します。WIN32_FIND_DATA
今、ユニコード設定に応じて と のstd::string
間で変化する std::strings が必要です。std::wstring
それは可能ですか?そうしないと、非常に複雑になる可能性があります。
c++11 - C++0x関数の削除-特定のタイプを除くすべてを削除します
C ++ 0xでは、次のようなことができます。
f()
以外のタイプで呼び出されないようにするためdouble
。
私がやろうとしていることは似ていますが、まったく同じではありません。
ポインタ配列を操作する関数があります。例えば:
Tをchar、char16_t、およびchar32_tで機能させたいのですが、他のタイプでは機能させたくありません。私はC++0xdelete
がこれを達成するための良い方法だろうと思っていました。基本的に、この関数が3つのUnicodechar
タイプのいずれでもないタイプで機能しないようにしたいのですが、それでも、タイプを一般化してコードの繰り返しを回避できる関数テンプレートの利点を活用したいと考えています。
この問題を解決するための最良の方法は何でしょうか?出来ますか?
python - if条件でのユニコード文字列との比較 (python)
重複の可能性:
Python '==' と 'is' で文字列を比較すると、'is' が失敗することがあります。なぜですか?
コードをどのようにテストしたかを説明する部分はスキップして、問題に直接ジャンプします。
Python では、if ステートメントでユニコード文字列を別のインライン ユニコード文字列に分割する際に問題が発生しているようです。
ここに私の実際のコードスニペットがあります
「ではない」を != に変更すると、コードは正常に動作します!
「が」原因で比較が失敗した理由を誰かが知っていますか?
python - hash.digest()をUnicodeに変換します
文字列は、私が使用できるようにUnicodeである必要がありますが、これは可能ですか?それが役立つ場合はPython2.7を使用してください...
vb.net - 文字列がUNICODE vb.netであることを確認する方法
文字列が VB.net を使用して UNICODE かどうかを確認する方法はありますか。
宜しくお願いします
c++ - VisualStudio2010はUnicodeのC++ソースコードと文字列リテラルのUnicode文字をサポートしていますか
非ASCIIUnicode文字を文字列リテラルに直接埋め込み、printfで使用したいと思います。これは、ソースコードをutf-8またはutf-16に保存する必要があることを意味します。Visual Studio 2010は、どちらの形式でもC++ソースファイルの編集と保存をサポートしています。ただし、コンパイルして実行すると、正しいUnicode文字は生成されません。コンパイラは、Unicode文字が埋め込まれた文字列リテラルをサポートしていますか?
例えば
java - XMLCDATAの制御文字を含むサーブレットからの文字列
私の質問は、XML 1.0で「制御」文字が不正なのはなぜですか?に似ています。-ただし、XML仕様でXMLの制御文字が許可されていない理由ではなく、以下の問題の解決策を探しています。
ユーザーの要求に応じてXMLを含む文字列を出力するサーブレットがあります。1つの特定の要素には、ユーザー入力テキストを含めるために必要なCDATAセクションが含まれています。
ある特定のケースでは、ユーザー入力に文字U + 0001(制御文字)が含まれていることがあります。また、文字セットをUTF-8として指定しても、サーブレットはエラーをスローします。
Java文字列を処理して「XMLセーフ」にする方法はありますか?特に、CDATAセクションに配置するときに安全にするために?
私の質問が明確であることを願っています!
よろしくお願いします、Raj