問題タブ [codepoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
qt - QChar を int にキャストする方法
C++ では、char を int にキャストし、ASCII 値を返す方法があります。qcharで同じことをする方法はありますか? Unicode は非常に多くの文字をサポートしており、それらのいくつかは実際に似ているため、何を扱っているかを判断するのが難しい場合があります。そのようなものを取得するために使用できる明示的なコードポイントまたは数値は非常に役立ちます。
私は Web とこのサイトで解決策を検索しましたが、これまでのところうまくいきません。何かを見落としていない限り、Qt のドキュメントもあまり役に立ちません。
前もって感謝します!
編集:
多分私はその問題について十分に明確ではありませんでした、申し訳ありません。
ここにいくつかのコードがあります:
また、Qtはこれを許可します:
私が知る限り、ch オブジェクトの Unicode コードポイントに関連する情報が必要です。そこから抜け出す可能性はありますか?
unicode - フォントレンダリングにおけるデフォルトの無視可能なコードポイントの目的は何ですか?
このリンクによると、U+00AD はデフォルトの無視可能なコード ポイントです。
これらのデフォルトの無視可能なコード ポイントの目的は何ですか? U+00AD をレンダリングしたい場合の害は何ですか?
リンクはいくつかの情報を提供しますが、私にはよくわかりません。
"U+00AD SOFT HYPHEN のデフォルトの外観は null です。ther-apist の外観は単に「セラピスト」です。目に見えるグリフはありません。改行処理では、単語内の区切りの可能性を示します。使用される単語内の区切りで改行の場合は、この文字によるものか自動プロセスによるものかにかかわらず、言語と文脈に応じて、ハイフン グリフ (おそらくスペルの変更による) またはその他の表示を表示できます。」
どうか明らかにしてください。
javascript - JavaScript文字列をコードポイントの配列に分割しますか? (「サロゲート ペア」は考慮されますが、「書記素クラスター」は考慮されません)
JavaScript 文字列を「文字」に分割することは簡単にできますが、Unicode を気にする場合 (そして Unicode を気にする必要がある場合) には問題があります。
JavaScript はネイティブに文字を 16 ビット エンティティ ( UCS-2 または UTF-16 ) として扱いますが、これはBMP (Basic Multilingual Plane)以外の Unicode 文字を許可しません。
BMP を超える Unicode 文字を処理するために、JavaScript は「サロゲート ペア」を考慮に入れる必要がありますが、これはネイティブには行われません。
コードポイントが1つまたは2つのJavaScript「文字」(コード単位)を必要とするかどうかにかかわらず、コードポイントでjs文字列を分割する方法を探しています。
必要に応じて、コードポイントによる分割では不十分な場合があり、"書記素クラスター" で分割することをお勧めします。ここで、クラスターはベース コードポイントであり、その後にすべての非間隔修飾子コードポイントが続きます (アクセントと発音記号の組み合わせなど) 。
この質問の目的のために、書記素クラスターによる分割は必要ありません。
unicode - Rebol 3のキャラクター比較
文字を比較して、一致するかどうかを確認しようとしています。うまくいかない理由がわかりません。私はtrue
出力を期待していますが、偽になっています。
unicode - UTF-16 予約コードポイント
UCS データベースで UTF-16 の範囲が予約されているのはなぜですか?
UTF-16 は、 one または two を使用して文字スカラー値を表す方法にすぎunsigned 16-bits
ません。これらの値のレイアウトは、文字スカラー値に関連付けてはなりません。そのような表現から実際の文字スカラー値を取得するには、何らかのアルゴリズムを適用する必要があるためです。
D800-DBFF
予約された範囲とが UCS データベースで予約されておらず、範囲内のすべての文字を単一DC00-DFFF
で表すことができる UTF-16 の別の表現があり、上位ビットが設定されている場合、別の 16 ビットの後に残りの文字が続くと仮定します。ビット、およびバイト オーダー マークについては、2 つの可能な値を予約します。それだけです。0-7FFF
unsigned 16-bits
もし私が間違っていたら、あなたは私にそれを説明してくれませんか。
ありがとう