大規模なデータ行列を使用して計算を行うプロジェクトに取り組んでいます。10,000 行と 100 列の CSV ファイルがあり、そのうち 10 個あります。現在、各 CSV からデータを読み取り、それを配列に取り込み、データに対していくつかの行列乗算計算を実行してから、次の CSV に移動するバックグラウンド ジョブを実行しています。ジョブの処理にかかる時間の大部分は CSV を開くのに費やされているように見えるので、これを行うためのより良い方法があると確信しています。私の質問は、現在これらの CSV ファイルにあるデータをどのように保存して、簡単にアクセスし、より効率的な方法で計算を実行するかということです。どんな助けでもいただければ幸いです
編集
コメントで示唆されているように、マトリックス密度は 100% であり、数値はすべて浮動小数点であることを付け加えたいと思います。