私は持っている
>>> import yaml
>>> yaml.dump(u'abc')
"!!python/unicode 'abc'\n"
でも私はしたい
>>> import yaml
>>> yaml.dump(u'abc', magic='something')
'abc\n'
タグ付けを強制しない魔法のパラメータは何ですか?
safe_dumpの代わりに使用できますdump。その場合、任意のPythonオブジェクトを表すことができないことに注意してください。また、loadYAMLを実行すると、のstr代わりにオブジェクトが取得されますunicode。
これはどう:
def unicode_representer(dumper, uni):
node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni)
return node
yaml.add_representer(unicode, unicode_representer)
これにより、Unicode オブジェクトのダンプが str オブジェクトのダンプと同じように機能するようです (Python 2.6)。
In [72]: yaml.dump(u'abc')
Out[72]: 'abc\n...\n'
In [73]: yaml.dump('abc')
Out[73]: 'abc\n...\n'
In [75]: yaml.dump(['abc'])
Out[75]: '[abc]\n'
In [76]: yaml.dump([u'abc'])
Out[76]: '[abc]\n'
interjay の優れた回答に少し加えて、ファイルのエンコーディングに注意すれば、リロード時に Unicode を保持できます。
# -*- coding: utf-8 -*-
import yaml
import codecs
data = dict(key = u"abcç\U0001F511")
fn = "test2.yaml"
with codecs.open(fn, "w", encoding="utf-8") as fo:
yaml.safe_dump(data, fo)
with codecs.open(fn, encoding="utf-8") as fi:
data2 = yaml.safe_load(fi)
print ("data2:", data2, "type(data.key):", type(data2.get("key")) )
print data2.get("key")
私のエディターのtest2.yamlコンテンツ:
{key: "abc\xE7\uD83D\uDD11"}
印刷出力:
('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>)
abcç
さらに、http://nedbatchelder.com/blog/201302/war_is_peace.html を読んだ後、いずれにしても safe_load/safe_dump が私が行きたい場所であると確信しています。
Python と YAML を使い始めたばかりですが、おそらくこれも役立つかもしれません。出力を比較するだけです:
def test_dump(self):
print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True)
print yaml.dump_all([{'name': 'value'}, {'name2': 1}])