問題タブ [cumulative-frequency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1087 参照

python - seabornによる欠落発生頻度の可視化

パンダ データフレームを介してデータセット内のサイクル (= 各480 値)による欠損データの発生頻度を視覚化するために、24x20 マトリックス (8 つのセクションにそれぞれ 60 セルまたは 6x10 がある) を作成し、各列にプロットしたいと思います。.'A''B''C'

これまでのところ、csvファイルの作成をマップし、値をマトリックスに正しい方法でマップしsns.heatmap(df.isnull())、欠落データ(nan & inf)をデータへの影響が最も少ない0ものに変更した後、プロットすることができました。0.01234プロットされます。以下はこれまでの私のスクリプトです:

問題は、どのセクションとセルで頻繁に発生するかを理解するために、欠落データの発生頻度を正しくプロットする方法がわからないことです。

注 1欠損値が多いほど色が明るくなり、サイクル全体の 100% 欠損データは白色で表示され、一色は欠損値がないことを示します。黒色の 0% から 100% の白色までの棒グラフが存在する可能性があります。

注 2 3 サイクルのデータセットのサンプル テキスト ファイルも提供します。欠落データはほとんど含まれていませんが、手動で変更して増やすことができます:データセット

期待される結果は次のようになります。

画像