HDF5 を使用して時系列の EEG データを保存しようとしています。これらのファイルは非常に大きく、多くのチャネルで構成されている可能性があり、HDF5 ファイル形式の機能 (遅延 I/O、動的圧縮、mpi など) が気に入っています。
EEG データで行う一般的なことの 1 つは、データのセクションを「興味深い」ものとしてマークすることです。これらのマークをファイルに保存する良い方法に苦労しています。同じデータセットを他のグループなどにリンクするためにサポートされているソフト/ハード リンクが表示されますが、データセットのセクションにリンクする方法がわかりません。
たとえば、睡眠データを含む EEG というデータセットがあるとします。データの処理に時間がかかり、レム睡眠の期間に対応するインデックスを生成するアルゴリズムを実行するとします。これらのインデックス範囲を HDF5 ファイルに保存する最良の方法は何ですか?
私が今考えることができる最善の方法は、3 つの列を持つデータセットを作成することです。最初の列は文字列で、イベント ("REM1") のラベルが含まれ、2 番目/3 番目の列にはそれぞれ開始/終了インデックスが含まれます。 . このソリューションが気に入らない唯一の理由は、HDF5 データセットのサイズがかなり設定されているためです。後でレム睡眠の期間が誤って識別され、そのイベントを追加/削除する必要があると判断した場合、データセットのサイズが必要になります。変更します(データセットを削除する/新しいサイズで再作成することは最適ではありません)。多くのイベント (まばたきイベントをマークすることを想像してください) がある可能性があるという事実によって、これはさらに問題になります。
HDF5 ファイルに、私が気付いていない機能があるかどうかを知りたいと思っています。