0

kmeans アルゴリズムがどのように機能するかは理解していると思いますが、データを使用してフォーマットにモデル化するのに多くの問題があります。

入力に基づいて最も類似したゲームを取得する方法を探しています。

例:

 Original_Game has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes. 
 Original_Game1 has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes.

私は、kmeans が、Similar_Games のどれが Original_Game と Original_Game1 の両方に最も似ているかを教えてくれると考えています。しかし、このデータを 2 次元プロットで整理する方法がわかりません。不明な場合はお知らせください。

4

1 に答える 1

0

k-means は、次のデータに対してのみ使用できます。

  • 合理的に数値化できる
  • 過度に離散的ではありません (バイナリ ベクトルに対して k-means を実行しないでください!)
  • ここで、すべての寸法はほぼ同じ意味を持ちます (つまり、x 軸で 1 cm、y 軸で約 1 cm)。
  • 平均を計算できる場所
  • 平均が分散を減少させる場合、それ以外の場合は収束しない可能性があります

K-means は理解しやすいですが、任意のデータに対しては機能しません。

たとえば、k-medoids / partitioning around medoids (PAM) に進むことで、これらの制限の一部を緩和できます。これは密接に関連するアルゴリズムであり、これらの制限のほとんどを取り除きますが、通常は非常に遅くなります。

于 2012-06-17T11:54:36.990 に答える