次の形式のデータがあります。
X,Y,sim(X,Y)
つまり、以下のトリプルのリストです。
- X、オブジェクトの名前。
- Y、別のオブジェクトの名前。
- sim(X,Y)、2 つのオブジェクト間の距離を表す実数。
ここで、このデータに教師なしクラスタリング アルゴリズムを適用したいと思います。私はWekaを念頭に置いていましたが、代替案も喜んで検討します.
次の形式のデータがあります。
X,Y,sim(X,Y)
つまり、以下のトリプルのリストです。
ここで、このデータに教師なしクラスタリング アルゴリズムを適用したいと思います。私はWekaを念頭に置いていましたが、代替案も喜んで検討します.
類似度行列を扱うことができるアルゴリズムはたくさんあります:
ほんの数例を挙げるだけです。ソフトウェアに関しては、私はELKIを好みます。これには、はるかに多くのクラスタリングの選択肢があります。