カテゴリ (名義および順序) 属性と数値属性の両方を含むデータセットがあります。これらの混合属性を使用して、観測全体で (非) 類似度マトリックスを計算したいと考えています。R のクラスター パッケージのdaisy()関数を使用すると、次のように非類似度マトリックスを簡単に取得できます。
if(!require("cluster")) { install.packages("cluster"); require("cluster") }
data(flower)
as.matrix(daisy(flower, metric = "gower"))
これはガワー計量を使用して名義変数を処理します。Rの関数に相当するPythonはありますか?daisy()
または、Gower メトリックまたは同様のものを使用して、混合 (公称、数値) 属性を持つデータセットの (非) 類似度マトリックスを計算できる他のモジュール関数でしょうか?