3

0,1,2 の 161X911 データ マトリックスがあり、マトリックス全体にいくつかの NaN があります。データに対して組み込み関数 kmeans を実行しようとしましたが、K(クラスター数) の値が 5 より大きいときはいつでも、これを返します

Warning: Ignoring rows of X with missing data. 
> In kmeans at 128
??? Error using ==> kmeans at 284
X must have more rows than the number of clusters.

これを回避する方法はありますか?NaNが含まれていないのは5行だけだと思います。

4

2 に答える 2

7

この質問のこの中心は、sに関する単純なプログラミングの質問を超えていNaNます。これは、欠測データが存在する場合のクラスタリングに関するより基本的な質問です。

これらの場合に何が行われるかの例を示すいくつかのリンクがあります。どちらの方法が最適かは、状況によって異なります。

  1. あなたがやりたいことをほぼ正確に示した紙。
  2. Googleコードでプロジェクトをコーディングする
  3. IEEEジャーナルの別の論文
于 2012-04-29T01:14:44.810 に答える
1

K-Means を使用する場合は、数字ではない場所に数字を配置する必要があります。これを行う 1 つの方法は、列ごとに非 NaN 値の平均を取り、その列の NaN をその値に置き換えることです。

于 2012-04-29T00:40:41.753 に答える