python-2.x - UCS2 と UCS4 の Python 文字の普及率

Question

組み込み関数 -unichr言う

引数の有効な範囲は、Python の構成方法によって異なります。UCS2 [0..0xFFFF] または UCS4 [0..0x10FFFF] のいずれかです。

と

組み込み関数 -ord言う

Unicode 引数が指定され、Python が UCS2 Unicode でビルドされている場合、文字のコードポイントは [0..65535] の範囲内にある必要があります。それ以外の場合、文字列の長さは 2 であり、TypeError が発生します。

code-unitの 2 つの定義が実稼働の Python インタープリターでどの程度広く使用されているかに関する統計はありますか?

#!/usr/bin/env python実行しているユーザーの環境に基づいて、さまざまなコードユニット定義で実行されるようなものを使用する Python スクリプトがどれほど普及しているかについて、何か考えはありますか?

バックグラウンド：

Python 3 がこれを強化したことを考えると、Python 2.x 用のパーサージェネレーターバックエンドを作成するために、両方の構成で機能する単一のライブラリを作成するためにどれだけの作業が必要か疑問に思っています。

具体的には、生成されたコードバンドルを不必要に肥大化させている可能性がありますか?

# Module my_generated_parser
try
  unichr(0x10000)
except ValueError:
  from my_generated_parser_ucs2 import *
else:
  from my_generated_parser_ucs4 import *

デフォルトで2つの生成されたパーサーが含まれていますか?

python-2.x - UCS2 と UCS4 の Python 文字の普及率

0 に答える 0

Related

Reference