問題タブ [codepoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python を使用して文字の Unicode コード ポイントを取得する
Python API で、単一文字の Unicode コード ポイントを抽出する方法はありますか?
編集:問題が発生した場合に備えて、私はPython 2.7を使用しています。
python - PythonのコードポイントでUnicode文字列を分割するにはどうすればよいですか? (例: \u00B7 または \u2022)?
考えられることはすべて試しました...
何も機能しませんでした
問題は、特殊文字で分割したいということです。
助けてください。
前もって感謝します。
php - PHPでutf8文字列をUnicodeコードポイントに変換するには?
重複の可能性:
UTF-8 から Unicode コード ポイントへ
UTF-8 文字列は Unicode コード ポイントに変換されます。utf8文字列を対応するUnicodeコードポイントに変換するには?
c++ - QChar.unicode()で結合文字のutf-16表現を報告するにはどうすればよいですか?
コードページ437のコーデックを作成しようとしています。私の計画は、ASCII文字を通過させ、utf-16値をキーとして使用して、テーブル内の残りの128文字をマップすることでした。
一部の組み合わせ文字(ドット、チルダなどの文字)の場合、文字は2つのQ文字を占有しているように見えます。
プログラムへの引数のutf-16値を出力するテストプログラム:
いくつかの出力:
期待していた
QStringで利用可能なさまざまな正規化フォームを試しましたが、デフォルトよりもバイト数が少ないものはありませんでした。
QCharは2バイトであるため、1つのオブジェクトに上記の文字の値を保持できるはずです。QStringが2つのQCharを使用するのはなぜですか?結合されたUnicode値を取得するにはどうすればよいですか?
python - PythonでUnicodeで16進値の長い文字列を簡単にエンコードする方法
長い文字列の16進コードポイント値があります。短いものについては、以下は問題ありません。
ただし、unichrの代替API unicode()が存在するため、コードポイント文字列全体を渡す方法が必要だと思いました。今のところ私はそれをすることができませんでした。
ここで、完全な文字列を生成するには、上記の3つのような150の16進値(コードポイント)の文字列を入力する必要があります。私は次のようなものを手に入れたいと思っていました
後者は「msg」を使用する必要があります。それを印刷することは単なる例でした。何か案は?
python - Pythonでコードポイントではなく文字としてUnicodeコードポイントを保存する方法
Unicodeコードポイントを実際の文字に置き換えることができるUnicode文字列をJSONに保存する方法はありますか?
たとえば、このようなdictをJSONに移植する...:
...コードポイントでダンプする代わりに、キーを実際の文字列としてダンプできますか?:
印刷は文字を表現するためにうまく機能しますが、保存することは私を失ってしまいます。ありがとう。
java - String.codePointAt は正確に何をしますか?
最近、Java の String のcodePointAtメソッドに出くわしました。他にもいくつかのcodePointメソッドcodePointBefore
を見つけましcodePointCount
た。
今、いつ、どのようにcodePointAt
、同様の方法を使用する必要があるのだろうか.
java - エンコードされた文字のコードポイントを確立する方法は?
バイト ストリーム (文字を表す) とストリームのエンコーディングが与えられた場合、文字のコード ポイントを取得するにはどうすればよいでしょうか?
上記のスニペットで read() によって返されるものは何ですか? それはユニコードのコードポイントですか?
mysql - MysqlはUnicodeコードポイントをutf-8文字に変換します
CHAR(code_point USING ucs2) を使用して Unicode コード ポイントを utf-8 文字に変換していましたが、0x00ff コード ポイントを超えると予期しない結果が生じます。コード ポイント 0x0100 から 0x01FF に対して文字 Â (コード ポイント 0x0100) が、コード ポイント 0x0200 から 0x02FF に対して文字 à (コード ポイント 0x0200) が返されます。
したがって、このクエリを実行すると:
、それは私に結果を与えます:
| | Â | Â | | | | |
一方、期待される結果は次のとおりです。
| | Â | ああ | | | | |
問題を理解するのを手伝ってください。または、これを行う別の方法を提案してください。
前もって感謝します..
c - コードポイントを C の wchar_t に変換する
str のこの 2 つの漢字「你好」の Unicode コードポイントがわかっている場合
この char * str コードポイントを漢字に変換して wchar_t * wstr に割り当てるにはどうすればよいですか?
このように直接割り当てて問題を解決できることを知っています。
しかし、私の問題はそれよりも複雑です。私の状況ではそれができません。
リテラル codepoint から wchar_t * への変換を行うにはどうすればよいですか?
ありがとう。
文字セットを MBCS に設定して MS Visual C を使用しています。UNICODE 文字セットを使用できないと想定しています。
更新: 申し訳ありませんが、wchar_t wstrをwchar_t * wstrに修正しました
更新 char * str には、2 つの漢字「你好」の UTF-8 コード単位のシーケンスが含まれています
MessageBox が日本語の文字を出力するのはなぜですか? 中国語の代わりに?使用する正しいロケール名は何ですか?