テーブルの作成時に を指定して、pytables/HDF5 コードのパフォーマンスを改善しようとしてchunkshape
います。chunkshape
パラメータの実際の寸法や形式がわかりません。コードから、最終的に単一の要素を持つタプルになることがわかります。
この単一の要素は、行数、バイト数、または何であると想定されていますか?
私の特定の問題は、20 列の HDF5 テーブルを作成する既存のコードがあることです。各列がディスクに連続して格納されるように、テーブルのチャンクを変更したいと思います。したがって、列全体を一度に読み取るように最適化します。
チャンクシェイプを 20 (列数) に設定してみましたが、これにより列全体を読み取るパフォーマンスが劇的に低下しました。チャンク形状を単一行の幅 (バイト単位) に設定する必要がありますか?
次の場合、chunkshapeがどうあるべきかを知りたいだけです:
- コラム全体をできるだけ早く読みたい。
- テーブル内の列数を正確に知っています。
- 下位互換性の理由から、単純にテーブルを変更して既存の行を列として、またはその逆にすることはできません。