重複の可能性:
HDF5 ファイルからのデータの削除
次のようなグループ構造を含む hdf5 ファイルがあります。
-->"Databases"
--> "Some name of some db"
--> Some field
--> Table 1
--> Table 2
--> Table 3
--> Some other field
--> Table 1
--> Table 2
これを繰り返して、「他のフィールド」を削除したいと思います。私はこれを行で達成します
h5file.removeNode(db, field_name, recursive=True) ここで、db は「Some name of some db」のオブジェクトで、フィールド名は文字列「Some other field」です。
フラッシュして保存すると、グループは削除されますが (yay!)、ファイル サイズは同じです (boo!)。この場合、最初のファイル サイズは 1.2Gb で、データの約 95% を含むグループを削除しました (約 20 の「フィールド」のうち 1 つだけを保持しました)。
何か不足していますか?グループはどういうわけか単なるメタデータであり、基礎となる配列データはまだ何らかの形でそこにあるのでしょうか? 必要な情報だけを含む小さなファイルを作成するにはどうすればよいですか?
どんなヒントでも大歓迎です。