関連するいくつかの異なるデータフレームがあります(必要に応じてそれらを結合するためのIDがあります)。ただし、常に同時に必要とは限りません。
それらは非常に大きいので、それらを別々の HDF ストアに格納することは理にかなっていますか? それとも、同じファイル内の他のフレームで作業しているときに、「未使用」のフレームを持ち歩くコストは無視できますか?
理論的には、IO サブシステム (異なるスピンドル、異なるストレージ システムなど) に関して HDF ファイルを分離できる場合は、DF を並行して読み取ることができます。実際には、データを使用してハードウェア上の特定のケースでテストします。など
ファイルを分離するもう 1 つの利点 - 複数の DF を含む HDF ストアから巨大な DF を削除したり、サイズを大幅に縮小したりしても、サイズは変更されません。別のファイルがある場合は、単純にドロップして未使用のスペースを解放できます
未使用のフレームを運ぶコストは、それらが別のファイルまたは同じファイルにある場合でも同じです。この SQL テーブルを別のデータベースまたは同じデータベースに格納する方が良いかどうかを自問してください。それらが関連している場合は、同じストアに保管してください。