のようなUnicodeカテゴリのカーディナリティを理解しようとしていますLo
。それについての信頼できる情報を見つけることができないようです。たとえば、 Fileformat.info11788
は、このカテゴリに文字が含まれるビューを維持し、 Codepoints.netは、基本プレーンに制限されている場合でも、122
Pythonは!:
と同じくらい低くなります。unicodedata
45301
In [219]: Lo=[unichr(c) for c in xrange(65536)
if unicodedata.category(unichr(c)) == 'Lo']
In [220]: len(Lo)
Out[220]: 45301
誰かがこれを解決するための信頼できる情報源を私に指摘できますか?!
編集:
len(Lo)
Pythonスニペットでの結果は、使用されているUCDのバージョン、つまりPythonのバージョンによって異なります。私の結果は、UCDバージョン5.1を使用するPython 2.6で、UCD5.2を使用するPython2.745877
は同じ式を生成し、UCD6.0を使用するPython3.2はおそらくさらに別の数値を生成します。