1

/を使用して次のコードを使用して、多くのNaN値を含む大きなデータセットを保存しています。HDFStorepythonpandas

with get_store(work_path+'/stores/store.h5') as store:
        for chunk in reader:
            for column in column_list:
                store.append('%s' % column, chunk[column],
                             data_columns=column)

numpyそして、最初の列を配列としてロードしたいので、次のようにします。

array = store.select(column_list[0]).as_matrix()

問題は、初期値のない小さな配列を取得することNaNです。ストアにデータを保存すると、値が「忘れられ」NaN、非NaN値とそのインデックスのみが保持されるためです。NaN初期値を含む配列を取得するにはどうすればよいですか?

4

1 に答える 1

4

を渡す必要があります。ここdropna=Falseを参照してください

参考までに、基本的に列ストアを作成しています (問題に適している場合とそうでない場合があります)。

于 2014-09-19T14:16:45.500 に答える