リスト(他のリストを含む)内のすべての文字列をpythonでユニコードに変換する最良の方法は何ですか?
例えば:
[['a','b'], ['c','d']]
に
[[u'a', u'b'], [u'c', u'd']]
>>> li = [['a','b'], ['c','d']]
>>> [[v.decode("UTF-8") for v in elem] for elem in li]
[[u'a', u'b'], [u'c', u'd']]
>>> l = [['a','b'], ['c','d']]
>>> map(lambda x: map(unicode, x), l)
[[u'a', u'b'], [u'c', u'd']]
残念ながら、ユニコードには簡単な答えはありません。しかし、幸いなことに、一度理解すれば、他のプログラミング言語にも引き継がれます。
これは、Python Unicode について私が見た中で群を抜いて最高のリソースです。
http://nedbatchelder.com/text/unipain/unipain.html
(キーボードの) 矢印キーを使用して、次のスライドと前のスライドに移動します。
また、これ (およびそのスライドショーの最後にある他のリンク) もご覧ください。