宿題
アルゴリズムのパフォーマンスを視覚化するために、混同行列以外の別の形式の評価が必要です。
宿題
アルゴリズムのパフォーマンスを視覚化するために、混同行列以外の別の形式の評価が必要です。
回帰のようなものである場合、多くの統計関係者は、データの上に近似曲線としてプロットするか、高次元の場合は近似曲線のさまざまな 2 次元投影としてプロットすることをお勧めします。また、プロットの他の部分よりもかすかに表示されるように、信頼区間と物事に重みを付け、可能性の低いものに応じて視覚的に重みを下げることもお勧めします。これに関する Andrew Gelman の最近の投稿は次のとおりです: (リンク)
ベイジアン事後分布の計算など、生成モデルを作成している場合は、事後予測チェックが適しています。回帰を行っている場合は、係数と値をまとめた表の値を過小評価しないでくださいR^{2}
。
データが xy 平面の一部のようにあるドメインの上に自然に収まる場合、または米国の各州のデータがある場合などは、ドメインの上にデータを重ねることは常に良いことです。データの分布を示す 1 つのプロット (ヒストグラムなど。ただし、問題領域の視覚的に意味のある部分の上にある密度である場合は一般的にはるかに優れています) を作成し、アルゴリズムの出力で同じ正確なプロットを複製します。データの分布とアルゴリズムの出力との間に視覚的に大きな違いがあると、アルゴリズムが正しい推論につながらない場所に注意が向けられます。
それが本当に鍵です。目標は、妥当な推論であり、比較的少量の分類エラーに当たらないようにすることです。適切な分類エラーが得られても、メソッドが過剰適合している場合は、おそらくこれらのタイプのプロットのいくつかに現れるでしょう。
一般的なアプローチは、ROC 曲線 ( http://en.wikipedia.org/wiki/Receiver_operating_characteristic ) を使用することです。それがバイナリ分類の問題であり、異なる結果を得るために変更できる分類子パラメーターがある場合です。バイナリ分類の問題でない場合でも、各ラベル (クラス) の ROC 曲線を計算できます。