python - PyTablesでhdf5ファイルの値を削除しようとしていますが、ファイルサイズは縮小していません

翻译自：https://stackoverflow.com/questions/12853217 2012-10-12T06:09:29.970

50 次

重複の可能性:
HDF5 ファイルからのデータの削除

次のようなグループ構造を含む hdf5 ファイルがあります。

-->"Databases"  
    --> "Some name of some db"
       --> Some field
          --> Table 1
             --> Table 2
             --> Table 3
       --> Some other field
             --> Table 1
             --> Table 2

これを繰り返して、「他のフィールド」を削除したいと思います。私はこれを行で達成します

h5file.removeNode(db, field_name, recursive=True) ここで、db は「Some name of some db」のオブジェクトで、フィールド名は文字列「Some other field」です。

フラッシュして保存すると、グループは削除されますが (yay!)、ファイルサイズは同じです (boo!)。この場合、最初のファイルサイズは 1.2Gb で、データの約 95% を含むグループを削除しました (約 20 の「フィールド」のうち 1 つだけを保持しました)。

何か不足していますか？グループはどういうわけか単なるメタデータであり、基礎となる配列データはまだ何らかの形でそこにあるのでしょうか? 必要な情報だけを含む小さなファイルを作成するにはどうすればよいですか?

どんなヒントでも大歓迎です。

python - PyTablesでhdf5ファイルの値を削除しようとしていますが、ファイルサイズは縮小していません

0 に答える 0

Related

Reference