非数値データセットにファジー c-means を適用できますか? つまり、カテゴリカルまたは数値とカテゴリの混合.. はいの場合 (そう願っています :( ):
- クラスターの中心を計算する方法
いいえの場合、代替手段は何ですか..これらのデータをファジークラスター化する方法は?
返信が必要です 助けてください
注: Jacard の係数を使用して 2 点間の距離を計算しましたが、クラスターの中心を計算する方法がわかりませんでした。添付ファイルを参照してください。
非数値データセットにファジー c-means を適用できますか? つまり、カテゴリカルまたは数値とカテゴリの混合.. はいの場合 (そう願っています :( ):
いいえの場合、代替手段は何ですか..これらのデータをファジークラスター化する方法は?
返信が必要です 助けてください
注: Jacard の係数を使用して 2 点間の距離を計算しましたが、クラスターの中心を計算する方法がわかりませんでした。添付ファイルを参照してください。
データを数値形式に変換する必要があります。それにはさまざまな方法がありますが、そのうちの 2 つは次のとおりです。
どちらも、多くの機械学習プログラムが内部で行う非常に一般的な変換です。また、ユークリッドとは異なるメトリックを試してみることもできます。特に。ワンホット表現を使用しますが、データによっては、L1 ノルム (マンハッタン/都市ブロックの距離) がより適切な場合があります。
それとは別に、指定された式を変換されたデータセットに適用するだけです。