大きなデータフレーム (形状 100 000*192) があります。すでに各属性のピアソン係数を計算しました。現在、すべてのグループのピアソン相関を計算する方法を探しています。私が言いたいのは、今のところ私が持っているということです
if A then B
そして計算したい
if (A AND B) then C
if (A AND B AND C) then (D AND E)
例えば
DataFrame 1
A B C
0|0 0 1
1|1 0 0
2|0 1 0
3|1 1 1
ここで、列 A と C には強い相関関係がないように見えますが、A と B または B と C のどちらにも強い相関関係はないようですが、A と B を取得すると、C との相関関係があります (A = B の場合、C =1、それ以外の場合は C = 0)。理解に役立つことを願っています。
すでにそれを行っている関数またはライブラリはありますか、それともデータフレームのdf.corr()
関数を使用pandas
して多くの反復をコーディングする必要がありますか?