scikit-learn の Imputerクラスを使用して、データセットの欠損値を予測するための非常に基本的なプログラムを作成しています。
NumPy 配列を作成し、strategy='mean' で Imputer オブジェクトを作成し、NumPy 配列で fit_transform() を実行しました。
fit_transform() を実行した後に配列を出力すると、「ナン」が残り、予測が得られません。
ここで何が間違っていますか?欠損値を予測するにはどうすればよいですか?
import numpy as np
from sklearn.preprocessing import Imputer
X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])
print X
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)
print X