3

私は Joel の記事を読み、多くの検索を行いました。Unicode に関するすべてのサイトと記事では、コード ポイントごとに 16 ビットがあることについて説明していますが、Unicode は Unicode プレーンで 2^16 を超えるコード ポイントをサポートしています。

しかし、Unicode 文字列が平面をどのように示すかを説明しているものはありません。さらに、これにより、Unicode 文字列が複数のプレーンからの文字をどのように保持できるかという問題が残ります。

では、平面は Unicode 文字列でどのように示されるのでしょうか?

4

2 に答える 2

2

誰かがこれについて私を自由に修正できます.私はまだUnicodeについて学んでいます.

コードポイントとエンコーディングがそのコードポイントを表す方法との間の混乱があると思います。コード ポイントあたりのビット/バイト数は、エンコーディングによって異なります。UTF-32 の最も単純な例を見てみましょう。UTF-32 を使用します。ドラムロールを使用してください。コード ポイントごとに 32 ビットです。各プレーンのすべての Unicode 文字を直接表すことができます。UTF-16 は可変長エンコーディングです。各コードポイントを 1 つまたは 2 つのコード単位でエンコードします。最初のプレーンは、単一のコード単位を使用して表されます。残りは、ここで詳しく読むことができます。http://en.wikipedia.org/wiki/UTF-16およびhttp://en.wikipedia.org/wiki/UTF-8

本質的に、エンコーディングが特定のプレーンをサポートしている場合、それらはそこにあり、エンコーディングで表されます。UTF-32 の場合は、他よりも明確です。

于 2011-03-29T22:22:16.403 に答える
2

このトピック (およびその他の Unicode の問題) を説明する章を、オープンソース プロジェクトのマニュアルに書きました。ここにPDF マニュアルへのリンクがあります(第 10 章を読んでください)。HTML バージョンのマニュアルのその章へのリンクを次に示します。

于 2011-03-29T22:35:39.407 に答える