Rを使用したk-centersクラスタリングの単純なライブラリ関数は見つかりませんが、k-means(kmeans()
)および階層的クラスタリング(hclust()
)の場合は見つかりました。
この投稿に示されているように、Rを使用した単純な欲張りk-centersクラスタリングのライブラリ関数はありますか?
そうでない場合(私はRに慣れていないので)、どのように実装しますか(ロジックを理解していますが、実際にRコードで記述する方法ではありません)。
Rを使用したk-centersクラスタリングの単純なライブラリ関数は見つかりませんが、k-means(kmeans()
)および階層的クラスタリング(hclust()
)の場合は見つかりました。
この投稿に示されているように、Rを使用した単純な欲張りk-centersクラスタリングのライブラリ関数はありますか?
そうでない場合(私はRに慣れていないので)、どのように実装しますか(ロジックを理解していますが、実際にRコードで記述する方法ではありません)。
で試しkmeans
てくださいmethod = "centers"
。
これがあなたが探しているものではない場合、CRANはhttp://cran.r-project.org/web/views/Cluster.htmlに数十のパッケージを含むクラスタータスクビューを持っています。
このブログ投稿で説明されていることから、これはk-meansに使用される多くのシード戦略の1つに似ているようです。まだクラスタリング手法とは呼んでいませんが、事前クラスタリングなどと呼んでいます。
たぶんあなたはflexclust
Rのパッケージを見る必要があります、私はそれがいくつかのk-meansバリエーションと初期化を持っていると信じています、そして多分それは1つの初期化オプションとしてこのバリアントを持っています。または、 http://cran.r-project.org/web/views/Cluster.htmlにある可能性があります
常に最も遠いオブジェクトを選択すると、クラスターの中心として外れ値を選択する傾向があることに注意してください。たとえば、同様のアイデアに基づくk-means ++を見てください。ただし、多少賢いです(さらに、ランダム化をより適切にサポートするため、複数の異なる初期化を試すことができます)。または、分位数に最も近いオブジェクトを選択することもできます(2k-1)/(2k)
。これは、適切なクラスター中心の推測として適しています。