私が使う :
import h5py
f = h5py.File('myfile.h5', 'r')
d = {}
for k in f.iterkeys():
d[k] = f[k][:]
HDF5 ファイル全体(2 GB、それぞれ 2 MB の 1000 個numpy
の配列)をメモリに読み込みます。
HDF5 のすべてのコンテンツをメモリにロードするより高速な方法はありますか?
(おそらく、ここでのループは、ファイル内で多くの「移動」(シーク?) を実行します。これは、それぞれf[k]
が与えられる順序で配置されていないためfor k in f.iterkeys()
ですか?)