“utf-32”の関連問題_Stack Overflow日本語サイト

0 投票する

5 に答える

18682 参照

utf-8 - UTF-16のポイントは何ですか？

UTF-16エンコーディングのポイントを理解したことはありません。文字列をランダムアクセスとして処理できるようにする必要がある場合（つまり、コードポイントがコードユニットと同じである場合）、UTF-16は可変長であるため、UTF-32が必要です。これが必要ない場合、UTF-16はUTF-8と比較して膨大なスペースの浪費のように見えます。UTF-8およびUTF-32に対するUTF-16の利点は何ですか？また、WindowsおよびJavaがそれをネイティブエンコーディングとして使用するのはなぜですか？

2011-03-13T20:28:00.323

0 投票する

1 に答える

723 参照

c - C の UTF-32 から UTF-8 へのコンバーター、バッファーはヌル / ゼロでいっぱいです

私はこれを機能させるために永遠に努力してきました。プログラムは、バッファサイズ用の on とファイル名用の 2 つの引数を取り、そのファイル形式を UTF-32 から UTF-8 に変換することになっています。fgetc() 関数を使用して、int 配列に Unicode コードポイントを入力しました。バッファの内容を出力する printint をテストしましたが、各コードポイントの代わりにこれらすべてのヌル文字が含まれています。

たとえば、文字「A」のみで構成されるファイルの場合: バッファ [0] は 0 バッファ [1] は 0 バッファ [2] は 0 バッファ [3] は 41

U+7F を超えるコードポイントは、最終的に分割されます。

バッファを初期化するためのコードは次のとおりです。

c unicode utf-8 fgetc utf-32

2011-04-10T01:17:53.827

0 投票する

3 に答える

16229 参照

utf-8 - 多国籍企業に最適な文字エンコード

世界中のすべての言語に翻訳される Web サイトがあり、これらすべての翻訳を含むデータベースがある場合、どの文字エンコーディングが最適でしょうか? UTF-128?

もしそうなら、すべてのブラウザは選択されたエンコーディングを理解していますか? 文字エンコーディングを実装するのは簡単ですか、それとも隠れた要因がありますか?

前もって感謝します。

utf-8 character-encoding utf-16 utf-32

2011-04-20T15:43:03.397

0 投票する

1 に答える

470 参照

visual-c++ - ファイルからテキストを読み取り、UTF32 に変換する

CSFML 1.6 ライブラリ (OpenGL ベースのマルチメディアライブラリ) を使用しています。私はポーランドに住んでいます。ここには次のような特殊文字があります。

これで、この文字で構成されるテキストファイルができました。CSFML は、表示された文字列に UnicodeText を設定する関数を提供します。引数は int の配列です。

ファイルから文字を正しく読み取り、この関数に渡すにはどうすればよいですか?

どんな助けでも本当に感謝しています。

visual-c++unicode utf-32

2011-07-10T10:31:44.413

0 投票する

2 に答える

5539 参照

c# - C＃で32ビットのUnicode文字を使用するにはどうすればよいですか？

たぶん私は32ビット文字列は必要ありませんが、32ビット文字を表す必要があります

http://www.fileformat.info/info/unicode/char/1f4a9/index.htm これで、symbolフォントを取得し、（URLまたは任意のテキスト領域に）貼り付けると文字が表示されるので、そのためのフォントサポート。

しかし、C＃/。NETアプリでどのようにサポートしますか？

-編集-何かを追加します。上記の文字を.NETwinformアプリに貼り付けたときに、文字が正しく表示されません。それをFirefoxに貼り付けると、正しく表示されます。WinFormアプリで文字を正しく表示するにはどうすればよいですか？

c#.net unicode utf-32

user34537

2011-07-23T15:30:02.417

0 投票する

2 に答える

1918 参照

python - Pythonで信頼できるUnicode文字数を取得するには?

Google App Engine は Python 2.5.2 を使用しており、明らかに UCS4 が有効になっています。ただし、GAE データストアは内部で UTF-8 を使用します。したがって、u'\ud834\udd0c' (長さ 2) をデータストアに格納すると、それを取得すると、'\U0001d10c' (長さ 1) が得られます。文字列を格納する前後で同じ結果が得られるように、文字列内の Unicode 文字の数を数えようとしています。そのため、文字列を受信したらすぐに (u'\ud834\udd0c' から '\U0001d10c' に) 正規化してから、その長さを計算してデータストアに入れようとしています。UTF-8にエンコードしてから再度デコードできることはわかっていますが、もっと簡単で効率的な方法はありますか?

python google-app-engine unicode utf-16 utf-32

2011-08-03T06:26:48.460

0 投票する

1 に答える

1649 参照

qt - Qtでは、QTextCodec :: codecForName（ "UTF-16"）とcodecForName（ "UTF-32"）は、使用するエンディアンをどのように決定しますか？

Qtのドキュメントには、（とりわけ）次のUnicode文字列エンコーディングがサポートされていると記載されています。

UTF-8
UTF-16
UTF-16BE
UTF-16LE
UTF-32
UTF-32BE
UTF-32LE

2オクテットと4オクテットでエンコードされたUnicodeにリストされている3つの異なるコーデックのため、2つの非エンディアンコーデック（「UTF-16」と「UTF-32」）がどちらのエンディアンを使用するかをどのように決定するのか疑問に思いました。

qt endianness utf-16 byte-order-mark utf-32

2011-09-15T11:30:10.427

0 投票する

2 に答える

826 参照

c++ - どのオープンソースCまたはC++ライブラリが任意のUTF-32をNFCに変換できますか？

どのオープンソースCまたはC++ライブラリが任意のUTF-32をNFCに変換できますか？

これまでのところ、これを実行できると思うライブラリ：ICU、Qt、GLib（わかりませんか？）。

他の複雑なUnicodeサポートは必要ありません。任意であるが既知の正しいUTF-32からNFC形式のUTF-32に変換するだけです。

私はこれを直接行うことができるライブラリに最も興味があります。たとえば、QtとICU（私が知る限り）はどちらも、UTF-16との間の中間変換ステージを介してすべてを実行します。

c++unicode open-source utf-32

2011-11-24T06:35:36.863

0 投票する

1 に答える

5170 参照

c - UTF-16 を UTF-32 に変換し、結果の wchar_t を C で出力する方法は?

UTF-16 文字の文字列を出力しようとしています。しばらく前にこの質問を投稿しましたが、iconv を使用して UTF-32 に変換し、wchar_t の文字列として出力するというアドバイスが与えられました。

私はいくつかの調査を行い、次のようにコーディングすることができました：

iconv 呼び出しは常に 0 を返すので、変換は問題ないと思いますか?

ただし、印刷は当たり外れがあるようです。変換された wchar_t 文字列が OK を出力する場合があります。また、wchar_t の出力中に問題が発生したように見え、printf 関数呼び出しを完全に終了させて、末尾の「***」も出力されないようにすることもあります。

私も使ってみました

しかし、何も印刷されません。

ここで何か不足していますか？

参考：CでUTF-16文字を出力するには？

アップデート

コメントにいくつかの提案を組み込みました。

更新されたコード:

それでも同じ結果ですが、すべての UTF-16 文字列が出力されるわけではありません (printf と wprintf の両方)。

他に何が欠けているのでしょうか？

ところで、私は Linux を使用しており、wchar_t が 4 バイトであることを確認しました。

c utf-16 iconv utf-32

2011-12-11T17:24:32.520

問題タブ [utf-32]

Reference