1

次の形式のデータがあります。

X,Y,sim(X,Y)

つまり、以下のトリプルのリストです。

  • X、オブジェクトの名前。
  • Y、別のオブジェクトの名前。
  • sim(X,Y)、2 つのオブジェクト間の距離を表す実数。

ここで、このデータに教師なしクラスタリング アルゴリズムを適用したいと思います。私はWekaを念頭に置いていましたが、代替案も喜んで検討します.

4

1 に答える 1

1

類似度行列を扱うことができるアルゴリズムはたくさんあります:

  • 階層リンケージ クラスタリング
  • DBスキャン
  • 光学
  • アフィニティ伝播
  • スペクトル クラスタリング

ほんの数例を挙げるだけです。ソフトウェアに関しては、私はELKIを好みます。これには、はるかに多くのクラスタリングの選択肢があります。

于 2014-05-17T11:52:56.973 に答える