問題タブ [codepoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 文字のコードポイントを取得する適切な方法は何ですか?
コードポイントと改行で何かをする必要があります。char
のコードポイントを取る関数があり、その場合は\r
別の動作をする必要があります。私はこれを持っています:
しかし、それは非常に醜く、正しい方法ではありません。これを行う正しい方法は何ですか?
13
(数字(の10進識別子)をハードコーディングしてそれを使用できることは知ってい\r
ますが、それを行うと、何をしているのかが不明確になります...)
unicode - サロゲート ペアは、UTF-16 で 2 バイトより大きいコード ポイントを表す唯一の方法ですか?
これはおそらくばかげた質問であることはわかっていますが、この問題について確信を持つ必要があります。たとえば、プログラミング言語がその String 型が UTF-16 エンコーディングを使用すると言っている場合、それは次のことを意味するかどうかを知る必要があります。
- U+0000 から U+FFFF の範囲のコード ポイントに 2 バイトを使用します。
- U+FFFF (コード ポイントあたり 4 バイト) より大きいコード ポイントにはサロゲート ペアを使用します。
または、一部のプログラミング言語は、エンコード時に独自の「トリック」を使用し、この標準に 100% 準拠していません。
unicode - Unicode にはコード ポイントの最大数が定義されていますか?
Unicode コード ポイントの最大数を知るために多くの記事を読みましたが、最終的な答えは見つかりませんでした。
UTF-8 UTF-16 および UTF-32 エンコーディングのすべてが同じ数のコード ポイントを処理できるようにするために、Unicode コード ポイントが最小化されていることを理解しました。しかし、このコードポイントの数は何ですか?
私が遭遇した最も頻繁な答えは、Unicode コード ポイントが 0x000000 から 0x10FFFF (1,114,112 コード ポイント) の範囲にあるというものですが、他の場所で 1,112,114 コード ポイントであることも読みました。与えられる数字は 1 つですか、それとも問題はそれよりも複雑ですか?
python - Python 文字列の絵文字 - \xF0\x9F\x92\x96 \xF0
_mysql_exceptions.Warning: 不正な文字列値: 行 1 の列 'title' の '\xF0\x9F\x92\x96 \xF0...'
s = "これは私の文字列です。ユーバー! 0\x9F\x92\x96 \xF0"
この文字列から-> この値のみを削除するにはどうすればよい0\x9F\x92\x96 \xF0
ですか?(またはこれをエンコードします)
編集:
javascript - Ruby Emoji Unicode で一部のアイコンが表示されない
ruby 2.2.2 と Emoji を使用していますが、何らかの理由で一部のアイコンが表示されません ( http://apps.timwhitlock.info/emoji/tables/unicodeから)
ユニコード: U+26F5
バイト (UTF-8): \xE2\x9B\xB5
説明: 帆船
誰かが知っているかもしれませんが、どうすれば修正できますか?
Java、JS、JRuby で動作することはわかっていますが、問題は次のとおりです。
https://en.wikipedia.org/wiki/UTF-8#Invalid_code_points
ありがとう!
これは JavaScript では機能しますが、JS 出力が ruby に返されると機能しません。
python - 文字列の順序で非ラテン文字のセットを並べ替えますか?
次のコード形式の並べ替えを使用しています。
非ラテン文字の場合、出力は入力と同じです。
私が期待しているのは:
ios - 名前による Unicode コード ポイントの検索
iOS の Swift/Objective-C のコード ポイントの名前で Unicode コード ポイントを検索する方法が必要です。したがって、ユーザーが「shade」と入力すると、U+2591 から U+2593 のように、shade という単語を含むコード ポイントが検索されます。これを行う最も効率的な方法は何でしょうか?
java - Java 8 の String.codePoints を使用して int codePoints の配列を取得した場合、配列の長さが文字数であるというのは本当ですか?
JavaString string
で指定された a は、人間が意味を持つ実際の文字string.codePoints().toArray().length
の長さを反映していますか? String
言い換えれば、エスケープ文字やその他のエンコーディングのアーティファクトを滑らかにしますか?
編集\r\n
「人間」とは、ほとんどのプログラマーが2文字、 1文字などと見なすと想像するように、「プログラマー」を意味ESC
していました。