クラスタリングには多くのアルゴリズムが利用可能です。一般的なアルゴリズムは K 平均法です。このアルゴリズムでは、指定された数のクラスターに基づいて、オブジェクトに最適なクラスターを見つけるために反復処理が行われます。
k-means クラスタリングでデータのクラスター数を決定するためにどの方法を使用しますか?
R で利用可能なパッケージにはV-fold cross-validation
、適切なクラスター数を決定する方法が含まれていますか?
もう 1 つのよく使用されるアプローチは、期待値の最大化 (EM) アルゴリズムです。これは、各インスタンスに確率分布を割り当て、各インスタンスが各クラスターに属する確率を示します。
このアルゴリズムは R で実装されていますか?
そうである場合、クロス検証によって最適な数のクラスターを自動的に選択するオプションはありますか?
代わりに、他のクラスタリング方法を使用しますか?