私は、将来の分析のために保存したいシミュレーションから 1,000 万から 1 億の出力を生成するプロジェクトに取り組んできました。データにはいくつかの性質の組織レベルがあります。たとえば、クラスルームには、いくつかの異なるパフォーマンス メトリックを持つテストを受ける生徒がいます。
私のデータは、一度にメモリに収まるという点で境界線にあるようです (シミュレーションの計算には、計算を行うためにメモリ内にかなりの量のデータが必要であることを考えると) が、差し迫った必要はありません。プログラムですべてのデータを一度に利用できるようにします。
計算値をSQLデータベースに出力するか、フラットテキストファイルに出力するか検討中です。どのアプローチがより速く/より維持しやすいかについてのアドバイスを探しています(または、私がそれを受け入れているデータを保存するための別の提案がある場合)。
データを他の人と共有できるようにする必要も、何年も先のデータへのアクセスについて心配する必要もありません。値の分析を微調整するたびにシミュレーションを再生成するのを避けるための便利な方法が必要です。