WEKAフレームワークでクラスターを評価していると言うとき、どういう意味ですか? クラスタリングは、オブジェクトをグループ化するための教師なしアプローチです。結果を評価したいと言うとき、私たちは何を意味するのでしょうか? また、これに加えて、トレーニング データ自体の上にクラスターを評価していると言うとき、それはどういう意味ですか?
ありがとうアビシェクS
WEKAフレームワークでクラスターを評価していると言うとき、どういう意味ですか? クラスタリングは、オブジェクトをグループ化するための教師なしアプローチです。結果を評価したいと言うとき、私たちは何を意味するのでしょうか? また、これに加えて、トレーニング データ自体の上にクラスターを評価していると言うとき、それはどういう意味ですか?
ありがとうアビシェクS
このページに書かれているように:
評価 Weka がクラスタリングを評価する方法は、選択したクラスター モードによって異なります。4 つの異なるクラスター モードを使用できます (クラスター モード パネルのボタンとして)。
Use training set
(デフォルト)。クラスタリングを生成した後、Weka はクラスター表現に従ってトレーニング インスタンスをクラスターに分類し、各クラスターに含まれるインスタンスの割合を計算します。たとえば、k-means によって生成された上記のクラスタリングは、クラスター 0 で 43% (6 インスタンス)、クラスター 1 で 57% (8 インスタンス) を示しています。Supplied test set
またはPercentage split
Weka は、クラスタ表現が確率論的である場合 (EM など)、別のテスト データでクラスタリングを評価できます。Classes to clusters evaluation
. このモードでは、Weka はまず class 属性を無視してクラスタリングを生成します。次に、テスト段階で、各クラスター内のクラス属性の過半数値に基づいて、クラスターにクラスを割り当てます。次に、この割り当てに基づいて分類誤差を計算し、対応する混同行列も表示します。k-means の例を以下に示します。