パンダで奇妙な問題が発生しています。複数の値を持つデータフレームがありNaNます。列平均を使用してこれらの値を埋めることができると思いましたNaN(つまり、すべてのNaN値をその列平均で埋めます)が、次のことを試してみると
col_means = mydf.apply(np.mean, 0)
mydf = mydf.fillna(value=col_means)
私はまだいくつかのNaN値を参照してください。なんで?
NaNのエントリよりも元のデータフレームに多くの値があるためcol_meansですか? そして、列ごとの塗りつぶしと行ごとの塗りつぶしの違いは正確には何ですか?