巨大な hdf5 からデータのサブセットを毎日選択したいと思います。where maskを使用するのは完璧ですが、マルチインデックスで機能させることはできません (2 つの条件で where を使用する必要があるため)。multiindex で where マスクを使用することはできません:
import itertools
import pandas as pd
import numpy as np
a = ('A', 'B')
i = (0, 1, 2)
idx = pd.MultiIndex.from_tuples(list(itertools.product(a, i)),
names=('Alpha', 'Int'))
df = pd.DataFrame(np.random.randn(len(idx), 7), index=idx,
columns=('I', 'II', 'III', 'IV', 'V', 'VI', 'VII'))
わかりました、今私はそれをhdfストアに入れました
from pandas.io.pytables import HDFStore
store =HDFStore('cancella.h5', 'w')
store.append('df_mask',df)
でも、もう一度読んだら、
c = store.select_column('df_mask','index')
print c
このインデックスは間違っています。
0 0
1 1
2 2
3 3
4 4
5 5
dtype: int64
そのため、 where maskは使用できません。手伝って頂けますか?