2

大規模なデータセットを処理しており、Pandas Profilling パッケージを使用しています。しかし、データセットが大きいため、レポートの生成に時間がかかりすぎて、ブラウザで開くことができません。そこで、相関行列と散布図を除外する「mininmal=True」コマンドを使用しました。Pandas Profilling を使用して、相関行列と散布図のみを生成する方法はありますか。

from pandas_profiling import ProfileReport
profile = ProfileReport(df, title='EDA_Raw_Data', html={'style':{'full_width':True}},minimal=True)
profile.to_file(output_file="EDA1_Raw_Data.html")
4

1 に答える 1

2

これは部分的に可能です。

pandas-profiling の構成を散布図 (または hexbin) と相関プロットのみを表示するように設定するには、最小構成から開始できます。

https://github.com/pandas-profiling/pandas-profiling/blob/master/src/pandas_profiling/config_minimal.yaml

次に、構成を変更して、無効にしたい計算を除外します (たとえば、サンプルをゼロに設定します)。

from pandas_profiling import ProfileReport
profile = ProfileReport(df, configuration_file="your_config.yml")
profile.to_file("EDA1_Raw_Data.html")

現時点では、すべての計算を無効にすることはできません (v2.6.0)。そのためのリポジトリで機能リクエストを行ってください。

(免責事項: 作成者はこちら。今後の v2.7.0 には大幅なパフォーマンスの改善が含まれていることに注意してください。これにより、問題が解決される可能性もあります。)

于 2020-05-07T12:36:23.267 に答える