1

単純ベイズ分類器オブジェクトnb(多変量多項 ( mvmn) 分布など)を作成した後、オブジェクトposteriorを使用してテスト データで関数を呼び出すことができnbます。この関数には 3 つの出力パラメーターがあります。

[post,cpre,logp] = posterior(nb,test)

各クラスの最大事後確率に基づいて、 がどのようpostに計算され、その意味が予測されるクラスであるかを理解しています。cpre

についての質問ですlogp。それがどのように計算されるか (テストの各パターンの PDF の対数) は明らかですが、この尺度の意味と、単純ベイズ手順のコンテキストでどのように使用できるかはわかりません。これに関する任意の光は非常に高く評価されています。

ありがとう。

4

1 に答える 1

1

logpあなたが参照しているのは対数尤度です。これは、モデルの適合度を測定する 1 つの方法です。非常に小さな浮動小数点数でコンピューターがアンダーフローするのを防ぐために、また加算は乗算よりも高速であるため、対数確率を使用します。

異なる開始点で分類器を数回学習した場合、尤度関数が対数凹ではないため、異なる結果が得られます。つまり、行き詰まる極大値があることを意味します。モデルの可能性を得るデータ。尤度は、あるセットのパラメーターが別のセットと比較してどのように適合するかを示す適切な尺度になりますが、過適合にならないように注意する必要があります。

あなたの場合、観測されていない (テスト) データの可能性を計算しています。これにより、学習した分類子がデータにどれだけ適合しているかがわかります。テスト セットに基づいてこのモデルを学習しようとしている場合は、テストの可能性が最も高いパラメーターを選択します。ただし、一般的にこれを行う場合は、検証セットを使用することをお勧めします。ここで行っているのは、予測可能性を計算することです。

対数尤度の計算は単純ベイズ分類器に限定されず、実際には任意のベイジアン モデル (ガウス混合、潜在ディリクレ配分など) に対して計算できます。

于 2013-03-22T18:59:22.297 に答える