引数の有効な範囲は、Python の構成方法によって異なります。UCS2 [0..0xFFFF] または UCS4 [0..0x10FFFF] のいずれかです。
と
Unicode 引数が指定され、Python が UCS2 Unicode でビルドされている場合、文字のコード ポイントは [0..65535] の範囲内にある必要があります。それ以外の場合、文字列の長さは 2 であり、TypeError が発生します。
code-unitの 2 つの定義が実稼働の Python インタープリターでどの程度広く使用されているかに関する統計はありますか?
#!/usr/bin/env python
実行しているユーザーの環境に基づいて、さまざまなコードユニット定義で実行されるようなものを使用する Python スクリプトがどれほど普及しているかについて、何か考えはありますか?
バックグラウンド:
Python 3 がこれを強化したことを考えると、Python 2.x 用のパーサー ジェネレーター バックエンドを作成するために、両方の構成で機能する単一のライブラリを作成するためにどれだけの作業が必要か疑問に思っています。
具体的には、生成されたコードバンドルを不必要に肥大化させている可能性がありますか?
# Module my_generated_parser
try
unichr(0x10000)
except ValueError:
from my_generated_parser_ucs2 import *
else:
from my_generated_parser_ucs4 import *
デフォルトで2つの生成されたパーサーが含まれていますか?