問題タブ [cumulative-frequency]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - seabornによる欠落発生頻度の可視化
パンダ データフレームを介してデータセット内のサイクル (= 各480 値)による欠損データの発生頻度を視覚化するために、24x20 マトリックス (8 つのセクションにそれぞれ 60 セルまたは 6x10 がある) を作成し、各列にプロットしたいと思います。.'A'
'B'
'C'
これまでのところ、csvファイルの作成をマップし、値をマトリックスに正しい方法でマップしsns.heatmap(df.isnull())
、欠落データ(nan & inf)をデータへの影響が最も少ない0
ものに変更した後、プロットすることができました。0.01234
プロットされます。以下はこれまでの私のスクリプトです:
問題は、どのセクションとセルで頻繁に発生するかを理解するために、欠落データの発生頻度を正しくプロットする方法がわからないことです。
注 1欠損値が多いほど色が明るくなり、サイクル全体の 100% 欠損データは白色で表示され、黒一色は欠損値がないことを示します。黒色の 0% から 100% の白色までの棒グラフが存在する可能性があります。
注 2 3 サイクルのデータセットのサンプル テキスト ファイルも提供します。欠落データはほとんど含まれていませんが、手動で変更して増やすことができます:データセット
期待される結果は次のようになります。