この公開ページ BCubed の適合率と再現率によると、F1-Measure 計算は、クラスタリングのパフォーマンスを評価するための最良の手法です。Amigó、Enrique などを参照してください。「正式な制約に基づく外部クラスタリング評価指標の比較」。情報検索 12.4 (2009): 461-486。
下の画像のように、BCubed の計算を示しています。
私が理解している限り、各アイテムの精度と再現率を計算し、それらの合計の平均をとりますか?
ただし、下の画像に見られるように、私の理解は与えられた評価と一致していません
クラスターの均一性の例 - 左側の画像によると、BCubed の精度を以下のように計算しますが、一致しません。
black : 4/4
gray: 4/7
Other three each one : 1/7
so average precision is : (4/4 + 4/6 + 1/7 + 1/7 + 1/7) / 5
ただし、これは画像の結果と一致しません。0.59
項目の BCubed 精度は、項目のカテゴリ (それ自体を含む) を持つクラスター内の項目の割合です。全体の BCubed 精度は、分布内のすべての項目の平均精度です。平均はアイテム全体で計算されるため、クラスタやカテゴリのサイズに応じて重み付けを適用する必要はありません。BCubed のリコールも同様で、「クラスター」を「カテゴリー」に置き換えています。