“codepoint”の関連問題_Stack Overflow日本語サイト

0 投票する

5 に答える

72185 参照

python - Python を使用して文字の Unicode コードポイントを取得する

Python API で、単一文字の Unicode コードポイントを抽出する方法はありますか?

編集：問題が発生した場合に備えて、私はPython 2.7を使用しています。

2011-09-03T04:12:47.930

0 投票する

1 に答える

2006 参照

python - PythonのコードポイントでUnicode文字列を分割するにはどうすればよいですか? (例: \u00B7 または \u2022)?

考えられることはすべて試しました...

何も機能しませんでした

問題は、特殊文字で分割したいということです。

助けてください。

前もって感謝します。

python unicode split points codepoint

2011-12-03T14:52:27.993

0 投票する

0 に答える

86 参照

php - PHPでutf8文字列をUnicodeコードポイントに変換するには?

重複の可能性:
UTF-8 から Unicode コードポイントへ

UTF-8 文字列は Unicode コードポイントに変換されます。utf8文字列を対応するUnicodeコードポイントに変換するには?

php unicode utf-8 codepoint

2012-03-22T05:13:42.727

0 投票する

2 に答える

3187 参照

c++ - QChar.unicode（）で結合文字のutf-16表現を報告するにはどうすればよいですか？

コードページ437のコーデックを作成しようとしています。私の計画は、ASCII文字を通過させ、utf-16値をキーとして使用して、テーブル内の残りの128文字をマップすることでした。

一部の組み合わせ文字（ドット、チルダなどの文字）の場合、文字は2つのQ文字を占有しているように見えます。

プログラムへの引数のutf-16値を出力するテストプログラム：

いくつかの出力：

期待していた

QStringで利用可能なさまざまな正規化フォームを試しましたが、デフォルトよりもバイト数が少ないものはありませんでした。

QCharは2バイトであるため、1つのオブジェクトに上記の文字の値を保持できるはずです。QStringが2つのQCharを使用するのはなぜですか？結合されたUnicode値を取得するにはどうすればよいですか？

c++qt unicode qstring codepoint

2012-06-11T09:59:47.583

0 投票する

3 に答える

276 参照

python - PythonでUnicodeで16進値の長い文字列を簡単にエンコードする方法

長い文字列の16進コードポイント値があります。短いものについては、以下は問題ありません。

ただし、unichrの代替API unicode（）が存在するため、コードポイント文字列全体を渡す方法が必要だと思いました。今のところ私はそれをすることができませんでした。

ここで、完全な文字列を生成するには、上記の3つのような150の16進値（コードポイント）の文字列を入力する必要があります。私は次のようなものを手に入れたいと思っていました

後者は「msg」を使用する必要があります。それを印刷することは単なる例でした。何か案は？

python unicode codepoint

2012-08-08T07:36:22.440

0 投票する

2 に答える

776 参照

python - Pythonでコードポイントではなく文字としてUnicodeコードポイントを保存する方法

Unicodeコードポイントを実際の文字に置き換えることができるUnicode文字列をJSONに保存する方法はありますか？

たとえば、このようなdictをJSONに移植する...：

...コードポイントでダンプする代わりに、キーを実際の文字列としてダンプできますか？：

印刷は文字を表現するためにうまく機能しますが、保存することは私を失ってしまいます。ありがとう。

python json unicode codepoint

2012-08-15T21:29:39.243

0 投票する

4 に答える

21807 参照

java - String.codePointAt は正確に何をしますか?

最近、Java の String のcodePointAtメソッドに出くわしました。他にもいくつかのcodePointメソッドcodePointBeforeを見つけましcodePointCountた。

今、いつ、どのようにcodePointAt、同様の方法を使用する必要があるのだろうか.

java string unicode codepoint

2012-09-05T11:51:09.377

0 投票する

2 に答える

541 参照

java - エンコードされた文字のコードポイントを確立する方法は?

バイトストリーム (文字を表す) とストリームのエンコーディングが与えられた場合、文字のコードポイントを取得するにはどうすればよいでしょうか?

上記のスニペットで read() によって返されるものは何ですか? それはユニコードのコードポイントですか？

java unicode codepoint

2013-01-08T19:20:48.447

0 投票する

1 に答える

7212 参照

mysql - MysqlはUnicodeコードポイントをutf-8文字に変換します

CHAR(code_point USING ucs2) を使用して Unicode コードポイントを utf-8 文字に変換していましたが、0x00ff コードポイントを超えると予期しない結果が生じます。コードポイント 0x0100 から 0x01FF に対して文字 Â (コードポイント 0x0100) が、コードポイント 0x0200 から 0x02FF に対して文字 à (コードポイント 0x0200) が返されます。

したがって、このクエリを実行すると:

、それは私に結果を与えます：

| | Â | Â | | | | |

一方、期待される結果は次のとおりです。

| | Â | ああ | | | | |

問題を理解するのを手伝ってください。または、これを行う別の方法を提案してください。

前もって感謝します..

mysql utf-8 char codepoint

2013-02-12T11:41:57.437

0 投票する

1 に答える

1031 参照

c - コードポイントを C の wchar_t に変換する

str のこの 2 つの漢字「你好」の Unicode コードポイントがわかっている場合

この char * str コードポイントを漢字に変換して wchar_t * wstr に割り当てるにはどうすればよいですか?

このように直接割り当てて問題を解決できることを知っています。

しかし、私の問題はそれよりも複雑です。私の状況ではそれができません。

リテラル codepoint から wchar_t * への変換を行うにはどうすればよいですか?

ありがとう。

文字セットを MBCS に設定して MS Visual C を使用しています。UNICODE 文字セットを使用できないと想定しています。

更新: 申し訳ありませんが、wchar_t wstrをwchar_t * wstrに修正しました

更新 char * str には、2 つの漢字「你好」の UTF-8 コード単位のシーケンスが含まれています

MessageBox が日本語の文字を出力するのはなぜですか? 中国語の代わりに？使用する正しいロケール名は何ですか?

c visual-studio encoding cjk codepoint

2013-04-12T07:06:55.160

問題タブ [codepoint]

Reference