問題タブ [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
14142 参照

qt - QChar を int にキャストする方法

C++ では、char を int にキャストし、ASCII 値を返す方法があります。qcharで同じことをする方法はありますか? Unicode は非常に多くの文字をサポートしており、それらのいくつかは実際に似ているため、何を扱っているかを判断するのが難しい場合があります。そのようなものを取得するために使用できる明示的なコードポイントまたは数値は非常に役立ちます。

私は Web とこのサイトで解決策を検索しましたが、これまでのところうまくいきません。何かを見落としていない限り、Qt のドキュメントもあまり役に立ちません。

前もって感謝します!

編集:

多分私はその問題について十分に明確ではありませんでした、申し訳ありません。

ここにいくつかのコードがあります:

また、Qtはこれを許可します:

私が知る限り、ch オブジェクトの Unicode コードポイントに関連する情報が必要です。そこから抜け出す可能性はありますか?

0 投票する
0 に答える
349 参照

unicode - フォントレンダリングにおけるデフォルトの無視可能なコードポイントの目的は何ですか?

このリンクによると、U+00AD はデフォルトの無視可能なコード ポイントです。

これらのデフォルトの無視可能なコード ポイントの目的は何ですか? U+00AD をレンダリングしたい場合の害は何ですか?

リンクはいくつかの情報を提供しますが、私にはよくわかりません。

"U+00AD SOFT HYPHEN のデフォルトの外観は null です。ther-apist の外観は単に「セラピスト」です。目に見えるグリフはありません。改行処理では、単語内の区切りの可能性を示します。使用される単語内の区切りで改行の場合は、この文字によるものか自動プロセスによるものかにかかわらず、言語と文脈に応じて、ハイフン グリフ (おそらくスペルの変更による) またはその他の表示を表示できます。」

どうか明らかにしてください。

0 投票する
4 に答える
5714 参照

javascript - JavaScript文字列をコードポイントの配列に分割しますか? (「サロゲート ペア」は考慮されますが、「書記素クラスター」は考慮されません)

JavaScript 文字列を「文字」に分割することは簡単にできますが、Unicode を気にする場合 (そして Unicode を気にする必要がある場合) には問題があります。

JavaScript はネイティブに文字を 16 ビット エンティティ ( UCS-2 または UTF-16 ) として扱いますが、これはBMP (Basic Multilingual Plane)以外の Unicode 文字を許可しません。

BMP を超える Unicode 文字を処理するために、JavaScript は「サロゲート ペア」を考慮に入れる必要がありますが、これはネイティブには行われません。

コードポイントが1つまたは2つのJavaScript「文字」(コード単位)を必要とするかどうかにかかわらず、コードポイントでjs文字列を分割する方法を探しています。

必要に応じて、コードポイントによる分割では不十分な場合があり、"書記素クラスター" で分割することをお勧めします。ここで、クラスターはベース コードポイントであり、その後にすべての非間隔修飾子コードポイントが続きます (アクセントと発音記号の組み合わせなど) 。

この質問の目的のために、書記素クラスターによる分割は必要ありません。

0 投票する
2 に答える
136 参照

unicode - Rebol 3のキャラクター比較

文字を比較して、一致するかどうかを確認しようとしています。うまくいかない理由がわかりません。私はtrue出力を期待していますが、偽になっています。

0 投票する
2 に答える
554 参照

unicode - UTF-16 予約コードポイント

UCS データベースで UTF-16 の範囲が予約されているのはなぜですか?

UTF-16 は、 one または two を使用して文字スカラー値を表す方法にすぎunsigned 16-bitsません。これらの値のレイアウトは、文字スカラー値に関連付けてはなりません。そのような表現から実際の文字スカラー値を取得するには、何らかのアルゴリズムを適用する必要があるためです。

D800-DBFF予約された範囲とが UCS データベースで予約されておらず、範囲内のすべての文字を単一DC00-DFFFで表すことができる UTF-16 の別の表現があり、上位ビットが設定されている場合、別の 16 ビットの後に残りの文字が続くと仮定します。ビット、およびバイト オーダー マークについては、2 つの可能な値を予約します。それだけです。0-7FFFunsigned 16-bits

もし私が間違っていたら、あなたは私にそれを説明してくれませんか。

ありがとう

0 投票する
2 に答える
404 参照

python - `os`が存在しないと考えるファイルを返すpython `os`