パンダで奇妙な問題が発生しています。複数の値を持つデータフレームがありNaN
ます。列平均を使用してこれらの値を埋めることができると思いましたNaN
(つまり、すべてのNaN
値をその列平均で埋めます)が、次のことを試してみると
col_means = mydf.apply(np.mean, 0)
mydf = mydf.fillna(value=col_means)
私はまだいくつかのNaN
値を参照してください。なんで?
NaN
のエントリよりも元のデータフレームに多くの値があるためcol_means
ですか? そして、列ごとの塗りつぶしと行ごとの塗りつぶしの違いは正確には何ですか?