私は現在、ギガバイトの科学データセットを扱う必要があるプロジェクトに取り組んでいます。データ セットは、整数と浮動小数点数の非常に大きな配列 (30,000 要素) の形式になっています。ここでの問題は、それらが大きすぎてメモリに収まらないことです。そのため、それらを保存して操作するためのオンディスク ソリューションが必要です。この問題をさらに楽しくするために、私は 32 ビット アーキテクチャの使用に制限されており (これは仕事のため)、このソリューションのパフォーマンスを最大化する必要があります。
これまでのところ、私は HDF5 で作業してきましたが、問題なく動作しましたが、作業するには少し複雑すぎることがわかりました。そのため、次善の策は NoSQL データベースを試すことだと思いましたが、配列を文字配列にキャストしてそのように格納する以外に、配列をデータベースに格納する良い方法を見つけることができませんでした。悪いポインターの頭痛.
そこで、おすすめの商品を教えていただきたいです。おそらく、パフォーマンスを最大化しながら、HDF5 で作業するより簡単な方法があるでしょう。または、このタイプのデータの保存に適した NoSQL データベースを知っているかもしれません。あるいは、私はこれで完全に間違った方向に進んでいて、あなたは私に何らかの意味をぶつけたいと思っているかもしれません.
とにかく、皆さんが私に提供できる知恵の言葉をいただければ幸いです:)