300x5000 で作業しているマトリックスがあり、どの距離計算パラメーターが最も効果的かをテストしたかったのです。次の結果が得られました。
'Sqeuclidean' = 17 回の反復、距離の合計 = 25175.4
「相関」 = 9 回の反復、距離の合計 = 32.7
'Cityblock' = 34 回の反復、距離の合計 = 105175.3
'コサイン' = 11 回の反復、距離の合計 = 11.9
結果が大きく異なる理由と、最も効果的な距離パラメーターを選択する方法を理解するのに苦労しています。何かアドバイス?
編集:
各機能のインスタンスが 5000 ある 300 の機能があります。関数は次のようになります。
[idx, ctrs, sumd, d] = kmeans(matrix, 25, 'distance', 'cityblock', 'replicate', 20)
距離パラメータを交換します。機能はすでに正規化されています。
ありがとう!