列Aにいくつかのラベル(クラスターラベルと呼びます)と列Bにいくつかの属性(クラスターコンポーネントと呼びます)を含むExcelのデータセットがあります。これらのデータは、最良のクラスタリング結果を示しています。
しかし、rapidminer でこれらのデータを使用して、他のクラスタリング手法の再現率と適合率を計算する方法がわかりません。
誰でも私を助けることができますか?
列Aにいくつかのラベル(クラスターラベルと呼びます)と列Bにいくつかの属性(クラスターコンポーネントと呼びます)を含むExcelのデータセットがあります。これらのデータは、最良のクラスタリング結果を示しています。
しかし、rapidminer でこれらのデータを使用して、他のクラスタリング手法の再現率と適合率を計算する方法がわかりません。
誰でも私を助けることができますか?
次のリンクは、RapidMiner オペレーター「ラベルのマップ クラスタリング」の使用例を示しています。これにより、既知のクラスター ラベルが、クラスタリング アルゴリズムによって割り当てられたクラスターにマップされます。これから、出力を使用して、精度と再現率を決定できる混同行列を作成できます。
それが役に立てば幸い...
クラス/ラベルの数が多い場合、精度と再現率は個々のクラスに対して行う必要があることに注意してください。