問題タブ [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
580 参照

java - 文字のコードポイントを取得する適切な方法は何ですか?

コードポイントと改行で何かをする必要があります。charのコードポイントを取る関数があり、その場合は\r別の動作をする必要があります。私はこれを持っています:

しかし、それは非常に醜く、正しい方法ではありません。これを行う正しい方法は何ですか?

13(数字(の10進識別子)をハードコーディングしてそれを使用できることは知ってい\rますが、それを行うと、何をしているのかが不明確になります...)

0 投票する
2 に答える
228 参照

unicode - サロゲート ペアは、UTF-16 で 2 バイトより大きいコード ポイントを表す唯一の方法ですか?

これはおそらくばかげた質問であることはわかっていますが、この問題について確信を持つ必要があります。たとえば、プログラミング言語がその String 型が UTF-16 エンコーディングを使用すると言っている場合、それは次のことを意味するかどうかを知る必要があります。

  1. U+0000 から U+FFFF の範囲のコード ポイントに 2 バイトを使用します。
  2. U+FFFF (コード ポイントあたり 4 バイト) より大きいコード ポイントにはサロゲート ペアを使用します。

または、一部のプログラミング言語は、エンコード時に独自の「トリック」を使用し、この標準に 100% 準拠していません。

0 投票する
3 に答える
16142 参照

unicode - Unicode にはコード ポイントの最大数が定義されていますか?

Unicode コード ポイントの最大数を知るために多くの記事を読みましたが、最終的な答えは見つかりませんでした。

UTF-8 UTF-16 および UTF-32 エンコーディングのすべてが同じ数のコード ポイントを処理できるようにするために、Unicode コード ポイントが最小化されていることを理解しました。しかし、このコードポイントの数は何ですか?

私が遭遇した最も頻繁な答えは、Unicode コード ポイントが 0x000000 から 0x10FFFF (1,114,112 コード ポイント) の範囲にあるというものですが、他の場所で 1,112,114 コード ポイントであることも読みました。与えられる数字は 1 つですか、それとも問題はそれよりも複雑ですか?

0 投票する
0 に答える
1157 参照

python - Python 文字列の絵文字 - \xF0\x9F\x92\x96 \xF0

_mysql_exceptions.Warning: 不正な文字列値: 行 1 の列 'title' の '\xF0\x9F\x92\x96 \xF0...'

s = "これは私の文字列です。ユーバー! 0\x9F\x92\x96 \xF0"

この文字列から-> この値のみを削除するにはどうすればよい0\x9F\x92\x96 \xF0ですか?(またはこれをエンコードします)

編集:

0 投票する
0 に答える
372 参照

javascript - Ruby Emoji Unicode で一部のアイコンが表示されない

ruby 2.2.2 と Emoji を使用していますが、何らかの理由で一部のアイコンが表示されません ( http://apps.timwhitlock.info/emoji/tables/unicodeから)

ユニコード: U+26F5

バイト (UTF-8): \xE2\x9B\xB5

説明: 帆船

誰かが知っているかもしれませんが、どうすれば修正できますか?

Java、JS、JRuby で動作することはわかっていますが、問題は次のとおりです。

https://en.wikipedia.org/wiki/UTF-8#Invalid_code_points

ありがとう!

これは JavaScript では機能しますが、JS 出力が ruby​​ に返されると機能しません。

0 投票する
2 に答える
165 参照

python - 文字列の順序で非ラテン文字のセットを並べ替えますか?

次のコード形式の並べ替えを使用しています。

非ラテン文字の場合、出力は入力と同じです。

私が期待しているのは:

0 投票する
1 に答える
62 参照

ios - 名前による Unicode コード ポイントの検索

iOS の Swift/Objective-C のコード ポイントの名前で Unicode コード ポイントを検索する方法が必要です。したがって、ユーザーが「shade」と入力すると、U+2591 から U+2593 のように、shade という単語を含むコード ポイントが検索されます。これを行う最も効率的な方法は何でしょうか?

0 投票する
3 に答える
1817 参照

java - Java 8 の String.codePoints を使用して int codePoints の配列を取得した場合、配列の長さが文字数であるというのは本当ですか?

JavaString stringで指定された a は、人間が意味を持つ実際の文字string.codePoints().toArray().lengthの長さを反映していますか? String言い換えれば、エスケープ文字やその他のエンコーディングのアーティファクトを滑らかにしますか?

編集\r\n「人間」とは、ほとんどのプログラマーが2文字、 1文字などと見なすと想像するように、「プログラマー」を意味ESCしていました。