2

私は Scipy スタックを使用してデータ分析に取り組んでおり、多くの場合、複雑な階層を持つデータがあります。たとえば、リストとして要素を持つ辞書と、これらのリストには複数の辞書が含まれています...

したがって、これらのデータをファイルに保存する必要があります。私は scipy.io.savemat を使用していますが、HDF5 の方が適切であり、プラットフォーム固有ではないことを読みました (savemat は Matlab 用です)。h5py の欠点は、ワークスペースに変数を直接保存する代わりに、複雑な構造を手動で複製する必要があることです (つまり、辞書ごとに、それに応じて手動で create_group する必要があります)。

Matlab で「.mat」ファイルを保存する方法のように、これを行う標準的な方法はありますか?

ありがとうございました!

-ショーン

4

2 に答える 2

1

Python からデータを読み取るだけで、データの一部を変更する必要がない場合は、pickle プロトコルを使用してデータを保存する方がはるかに簡単です。例えば

import cPickle
f=open('something.pickle','w+')
cPickle.dump(whatever_object_youd_like_to_save,f,protocol=2)

そして、それを使用してロードできます

your_object = cPickle.load(open('something.pickle'))
于 2013-07-31T19:30:04.053 に答える
0

joblibは、任意の Python オブジェクトをダンプできるもう 1 つのツールであり、NumPy 配列専用のストレージという利点が追加されています。

于 2013-07-31T19:58:07.337 に答える