問題タブ [char32-t]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unicode - char~char32_t型とUTF-8~UTF-32の関係は?
- char: 8 ビットの文字タイプ
- char16_t: 16 ビット文字型
- char32_t: 32 ビット文字型
- wchar_t: コンパイラに応じて 16 ~ 32 ビットの文字型
- UTF-8: 8 ビット文字を保持しながら Unicode 文字を表現できるエンコード方法
- UTF-16: 1 つまたは 2 つの 16 ビット値を使用して Unicode 文字をエンコードする方法
- UTF-32: すべての Unicode 文字を 32 ビットにエンコードする方法
上のような感じですが、よくわかりません。UTF-8、UTF-16、UTF-32 を char、char16_t、char32_t 型として実装しただけですか?
c++ - はchar32_t に相当するもの
<ctype>
forで定義されている char 関数 (ispace、isalpha など) に相当するものはありますchar32_t
か?
私は周りを見回して、16ビット文字用のように見えるiswspace(および関連)しか見ることができませんでした。
注: isspace はパラメーターとして int を受け取りますが、Unicode 文字に対して誤った結果を生成するようです。
例:
「それはスペースです!」と出力します。