問題タブ [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
visual-c++ - UCS2 対 UTF。UCS2 エンコーディングで表示できない言語は?
UCS2 は、UTF エンコードよりも Visual C++ での使用が容易です。UCS2 エンコーディングでサポートできない言語は?
mysql - エンコードの問題: ucs2_bin collate はキリル文字とギリシャ語をサポートしていません
Mysql データベースのフィールドに複数の言語でテキストを保存して比較する必要があります。実際、文字セットに uc2 を設定し、照合に ucs_bin を設定しましたが、キリル文字とギリシャ文字には機能しないことがわかりました。
どうすればこの問題を解決できますか? なにか提案を?
前もってありがとう
テオドロ
c# - 16ビットのUCS-2整数値をcharに変換するにはどうすればよいですか?
バイナリファイルから値を解析しています。私が解析している値の1つは、Unicode文字のUCS-2エンコーディングを表す16ビットの数値です。私はそれを次のようなキャラクターに変換しています:
これは安全ですか?
sql-server - C# 文字列 (UTF-16) を SQL Server nvarchar (UCS-2) 列に格納すると、どのような結果になりますか?
SQL Server は、フィールドに 2 バイトの固定長文字エンコーディングであるUnicode UCS-2を使用しているようです。nchar/nvarchar
一方、C# は文字列に Unicode UTF-16エンコーディングを使用します (注: UCS-2 を Unicode と見なさない人もいますが、Unicode サブセット 0-0xFFFF で UTF-16 と同じコード ポイントをすべてエンコードし、 SQL Server に関する限り、それは文字列に関してネイティブでサポートされている "Unicode" に最も近いものです。)
UCS-2 は Basic Multilingual Plane (BMP) で UTF-16 と同じ基本コード ポイントをエンコードしますが、サロゲート ペアを許可するために UTF-16 が行う特定のビット パターンを予約しません。
C# 文字列を SQL Server nvarchar
(UCS-2) フィールドに書き込んで読み返すと、常に同じ結果が返されますか?
UTF-16 はより多くのコード ポイント (たとえば 0xFFFF より上) をエンコードするという意味で、UTF-16 は UCS-2 のスーパーセットであると思われますが、実際には 2 バイト レベルでの UCS-2 のサブセットです。より制限的です。
私自身の質問に答えるために、C# 文字列に 0xFFFF (文字のペアで表される) を超えるコード ポイントが含まれている場合、これらはデータベースに保存され、取得されると思われますが、データベースでそれらを操作しようとすると (たとえば、おそらく TOUPPER を呼び出すか、1 文字おきに空白にしようとしている可能性があります)、後で文字列を表示する際に問題が発生する可能性があります... SQL Server にサロゲート ペアを認識し、nchar/nvarchar
文字列を UTF-16 として効果的に処理する関数がない限り。
mysql - MySQLの不正なineger値(エンコーディング)
さて、ここに私のデレマがあります。UCS-2でエンコードされ、基本的に「、」で区切られた2つの列である.rptファイルがあります。
私の質問は;
テキストは単純に2つのint列です。次のようなエラーが発生し続けます:エラーコード:1366整数値が正しくありません:行1の列'column1'の'ÿþ1'
usc-2のデフォルトの照合を使用してテーブルを作成しようとしましたが、それでも同じ問題が発生します。運が悪かったので、テーブルに一致するように.rptを別のエンコーディングに変換しようとしました。
ありがとう
unicode - UCS-2 にも存在するバイト単位の最長の UTF-8 エンコード文字は何ですか?
UCS-2 と UTF-8 エンコーディングの両方に存在し、UTF-8 でバイト単位のサイズが最も長い Unicode 文字を知りたいです。
perl - Perl を使用して数値 16 進形式の UCS2 (未知の LE または BE) を UTF-8 に変換する
誰かが私がこれで間違っている方向に私を向けることができることを願っています:
(私が信じている) 16 進エンコードされた UCS2 の文字列がありますが、プロバイダーはそれが UCS2-LE か UCS2-BE かを教えてくれません。
そのように: 0627062E062A062806270631
これは次のように翻訳されます。
アラビア語ではどうやら...しかし、それを16進数から変換しようとしても、それをまっすぐなUCS2(LEまたはBE)として使用しても、実際に太陽の下で考えることができる他のものとして使用しても、ネイティブに変換することはできません- perl UTF-8 を使用して、標準の UTF-8 (システムのネイティブ形式) として再エンコードできるようにします。
コード:
現時点では意味不明な文字を出力します。
私が思いついたアイデアの 1 つは、問題の文字列を 4 文字のセクション (つまり、16 進コードごと) に分割することでしたが、これを個々の既知の UCS2 16 進値で試してもうまくいかないようです。
また、出力エンコーディングを強制しようとしましたが、そこにも喜びはありませんでした。
ありがとう!
python - python base64文字列のデコード
UCS-2 でエンコードされた xml ドキュメントと思われるものを手に入れました。これを微調整した後、minidom に基づいて DOM を構築することができました。
問題は、base64 でエンコードされたデータがあるはずだということです。私は事実を知っています:
どうすればそれをデコードできますか?
http://www.fileformat.info/info/unicode/char/00c1/index.htmは、Á の Unicode 表現が u"\u00C1" で、UTF-16 では 0x00C1 であることを示しています。
ショー
文字の Unicode 表現としてですが、バイトスワップされているように見えます。
それをデコードする方法について何か考えはありますか?
ios - Objective-cでUTF-8値をUCS-2値に変換する方法を教えてもらえますか?
UTF-8 文字列を UCS-2 文字列に変換しようとしています。「\uFF0D\uFF0D\u6211\u7684\u4E0A\u7F51\u4E3B\u9875」のような文字列を取得する必要があります。私は今までに約1か月間グーグルで検索しましたが、UTF-8からUCS-2への変換に関するリファレンスはまだありません. 誰か助けてください。事前にthx。
編集:わかりました、多分私の説明は十分ではありませんでした。これが私がやろうとしていることです。私は韓国に住んでいて、CTMessageCenter を使用して SMS メッセージを送信しようとしています。アプリから簡体字を送信しようとしました。そして、私は????を取得します 適切な文字の代わりに。そこで、UTF-8、UTF-16、BE、LE も試してみました。しかし、それらはすべて戻ります??。最後に、韓国では SMS が UCS-2 および EUC-KR エンコーディングを使用していることを知りました。変ですね。とにかく、\u4E3B\u9875 のような文字列を送信しようとしましたが、うまくいきました。そのため、最初に文字列を UCS-2 エンコーディングに変換し、それらの文字列から文字列リテラルを取得する必要があります。
mysql - UCS-2 リトル エンディアンでエンコードされたファイルを UTF-8 の Mysql テーブルにアップロードする方法
UCS-2 リトル エンディアンでエンコードされた csv ファイルがあり、これを UTF-8 でエンコードされた MySQL テーブル (デフォルトの照合順序) にアップロードしたいと考えています。最善のアプローチが何であるかについて興味があります。スクリプトを書く必要がある場合は、それを行うことができますが、簡単な解決策があることを願っています!
ありがとう、AFrieze