python - データベース内で数値計算を行う必要がありますか?

Question

実行した多くのモデルの結果を含むデータベースがあります。各モデルの chi^2 値を計算する必要があります。Python と psycopg2パッケージを使用して、PostgreSQL データベースとやり取りしています。これを行うには 2 つの方法が考えられますが、どちらが速いか、または違いがあるかどうかはわかりません。

方法 1: データベースから各モデルに対応する行を選択し、python で chi^2 計算を行います。各モデルには約 500 ～ 1000 行が関連付けられており、それを読み込む必要があり、20,000 個のモデルがあります。

方法 2: データベース自体で chi^2 を計算する SQL 関数を作成し、モデルごとにこの数値を 1 つ選択します。

私は SQL よりも Python に精通しているので、それだけで方法 1 を使用したくなります。ただし、postgres にリレーショナル代数を最適化させてから、モデルごとに 1 つの数値を Python スクリプトに読み込むだけでよいという利点があることがわかります。ある方法を他の方法よりも選択する際に従うべき一般的な戦略はありますか?

score 1 · Accepted Answer

まず、chi^2 は複雑な計算ではありません。どの方法を使用しても問題ありません。ただし、方法 1 ではアプリケーションで OUT OF MEMORY エラーが発生する可能性があるため、方法 2 を使用することをお勧めします。

python - データベース内で数値計算を行う必要がありますか?

1 に答える 1

Related

Reference