clara
fromlibrary(cluster)
が NA を許可していることを知って驚きました。しかし、関数のドキュメントには、これらの値をどのように処理するかについては何も書かれていません。
だから私の質問は:
clara
NA はどのように処理されますか?- これはどういうわけか
kmeans
(Nasは許可されていません)に使用できますか?
[更新]それで、clara
関数内にコード行が見つかりました:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
による欠損値置換を行いますvalmisdat
。そのような式を使用する理由がわかりません。何か案は?NAを各列で個別に扱い、平均値/中央値に置き換える方が「自然」でしょうか?