問題タブ [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
72185 参照

python - Python を使用して文字の Unicode コード ポイントを取得する

Python API で、単一文字の Unicode コード ポイントを抽出する方法はありますか?

編集:問題が発生した場合に備えて、私はPython 2.7を使用しています。

0 投票する
1 に答える
2006 参照

python - PythonのコードポイントでUnicode文字列を分割するにはどうすればよいですか? (例: \u00B7 または \u2022)?

考えられることはすべて試しました...

何も機能しませんでした

問題は、特殊文字で分割したいということです。

助けてください。

前もって感謝します。

0 投票する
0 に答える
86 参照

php - PHPでutf8文字列をUnicodeコードポイントに変換するには?

重複の可能性:
UTF-8 から Unicode コード ポイントへ

UTF-8 文字列は Unicode コード ポイントに変換されます。utf8文字列を対応するUnicodeコードポイントに変換するには?

0 投票する
2 に答える
3187 参照

c++ - QChar.unicode()で結合文字のutf-16表現を報告するにはどうすればよいですか?

コードページ437のコーデックを作成しようとしています。私の計画は、ASCII文字を通過させ、utf-16値をキーとして使用して、テーブル内の残りの128文字をマップすることでした。

一部の組み合わせ文字(ドット、チルダなどの文字)の場合、文字は2つのQ文字を占有しているように見えます。

プログラムへの引数のutf-16値を出力するテストプログラム:

いくつかの出力:

期待していた

QStringで利用可能なさまざまな正規化フォームを試しましたが、デフォルトよりもバイト数が少ないものはありませんでした。

QCharは2バイトであるため、1つのオブジェクトに上記の文字の値を保持できるはずです。QStringが2つのQCharを使用するのはなぜですか?結合されたUnicode値を取得するにはどうすればよいですか?

0 投票する
3 に答える
276 参照

python - PythonでUnicodeで16進値の長い文字列を簡単にエンコードする方法

長い文字列の16進コードポイント値があります。短いものについては、以下は問題ありません。

ただし、unichrの代替API unicode()が存在するため、コードポイント文字列全体を渡す方法が必要だと思いました。今のところ私はそれをすることができませんでした。

ここで、完全な文字列を生成するには、上記の3つのような150の16進値(コードポイント)の文字列を入力する必要があります。私は次のようなものを手に入れたいと思っていました

後者は「msg」を使用する必要があります。それを印刷することは単なる例でした。何か案は?

0 投票する
2 に答える
776 参照

python - Pythonでコードポイントではなく文字としてUnicodeコードポイントを保存する方法

Unicodeコードポイントを実際の文字に置き換えることができるUnicode文字列をJSONに保存する方法はありますか?

たとえば、このようなdictをJSONに移植する...:

...コードポイントでダンプする代わりに、キーを実際の文字列としてダンプできますか?:

印刷は文字を表現するためにうまく機能しますが、保存することは私を失ってしまいます。ありがとう。

0 投票する
4 に答える
21807 参照

java - String.codePointAt は正確に何をしますか?

最近、Java の String のcodePointAtメソッドに出くわしました。他にもいくつかのcodePointメソッドcodePointBeforeを見つけましcodePointCountた。

今、いつ、どのようにcodePointAt、同様の方法を使用する必要があるのだろうか.

0 投票する
2 に答える
541 参照

java - エンコードされた文字のコードポイントを確立する方法は?

バイト ストリーム (文字を表す) とストリームのエンコーディングが与えられた場合、文字のコード ポイントを取得するにはどうすればよいでしょうか?

上記のスニペットで read() によって返されるものは何ですか? それはユニコードのコードポイントですか?

0 投票する
1 に答える
7212 参照

mysql - MysqlはUnicodeコードポイントをutf-8文字に変換します

CHAR(code_point USING ucs2) を使用して Unicode コード ポイントを utf-8 文字に変換していましたが、0x00ff コード ポイントを超えると予期しない結果が生じます。コード ポイント 0x0100 から 0x01FF に対して文字 Â (コード ポイント 0x0100) が、コード ポイント 0x0200 から 0x02FF に対して文字 à (コード ポイント 0x0200) が返されます。

したがって、このクエリを実行すると:

、それは私に結果を与えます:

| | Â | Â | | | | |

一方、期待される結果は次のとおりです。

| | Â | ああ | | | | |

問題を理解するのを手伝ってください。または、これを行う別の方法を提案してください。

前もって感謝します..

0 投票する
1 に答える
1031 参照

c - コードポイントを C の wchar_t に変換する

str のこの 2 つの漢字「你好」の Unicode コードポイントがわかっている場合

この char * str コードポイントを漢字に変換して wchar_t * wstr に割り当てるにはどうすればよいですか?

このように直接割り当てて問題を解決できることを知っています。

しかし、私の問題はそれよりも複雑です。私の状況ではそれができません。

リテラル codepoint から wchar_t * への変換を行うにはどうすればよいですか?

ありがとう。

文字セットを MBCS に設定して MS Visual C を使用しています。UNICODE 文字セットを使用できないと想定しています。

更新: 申し訳ありませんが、wchar_t wstrwchar_t * wstrに修正しました

更新 char * str には、2 つの漢字「你好」の UTF-8 コード単位のシーケンスが含まれています

MessageBox が日本語の文字を出力するのはなぜですか? 中国語の代わりに?使用する正しいロケール名は何ですか?