scipy を使用して階層的クラスタリングを実行するために、キーワード間の類似点の大きな csv があり、それを三角距離行列に変換したいと考えています (非常に大きく、スパースの方が優れているため)。現在のデータ csv は次のようになります。
a, b, 1
b, a, 1
c, a, 2
a, c, 2
これを行う方法がわからず、Python でのクラスタリングに関する簡単なチュートリアルが見つかりません。
助けてくれてありがとう!
scipy を使用して階層的クラスタリングを実行するために、キーワード間の類似点の大きな csv があり、それを三角距離行列に変換したいと考えています (非常に大きく、スパースの方が優れているため)。現在のデータ csv は次のようになります。
a, b, 1
b, a, 1
c, a, 2
a, c, 2
これを行う方法がわからず、Python でのクラスタリングに関する簡単なチュートリアルが見つかりません。
助けてくれてありがとう!