6 つの入力、1 つの隠れ層、2 つの出力ノード (1; 0) を持つフィードフォワード ニューラル ネットワークがあります。この NN は 0;1 の値で学習されます。モデルを適用すると、各行のこの 2 つの数値の合計が 1 である変数の信頼度 (0) と信頼度 (1) が作成されます。私の質問は、これらの 2 つの数値 (信頼度 (0) と信頼度 (1))正確には?これら2つの数字は確率ですか?
回答ありがとうございます
6 つの入力、1 つの隠れ層、2 つの出力ノード (1; 0) を持つフィードフォワード ニューラル ネットワークがあります。この NN は 0;1 の値で学習されます。モデルを適用すると、各行のこの 2 つの数値の合計が 1 である変数の信頼度 (0) と信頼度 (1) が作成されます。私の質問は、これらの 2 つの数値 (信頼度 (0) と信頼度 (1))正確には?これら2つの数字は確率ですか?
回答ありがとうございます
一般に
信頼値 (または他のプログラムではスコアと呼ばれる) は、提示された例が特定のクラスに属しているというモデルの信頼度を表します。それらは、一般的な戦略とアルゴリズムのプロパティに大きく依存しています。
例
説明する最も簡単な例は、元のテストセットの比率に基づいて、すべての観測値に同じスコアを割り当てるだけの多数派分類子です。
もう 1 つはk-nearest-neighbor-classifier の例です。クラス i のスコアは、k-nearest-neighbors に属し、クラス i を持つ例への距離を平均することによって計算されます。次に、スコアはすべてのクラスで合計正規化されます。
NNの具体例では、コードを見ないとどう計算されているのかわかりません。両方のクラスで合計正規化された出力ノードの値にすぎないと思います。
信頼度は確率を表していますか?
一般的にいいえ。このコンテキストで確率が何を意味するかを説明すると、例のクラス「1」の確率が 0.3 の場合、同様の特徴/変数値を持つすべての例の 30% がクラス「1」に属し、70% はそうではありません。
私の知る限り、彼の仕事は「校正」と呼ばれています。この目的のために、いくつかの一般的な方法 (スコアをビニングして、対応するビンのクラス分数にマッピングするなど) と分類器に依存する方法 ( SVM 用に発明されたPlatt Scalingなど) が存在します。開始するのに適したポイントは次のとおりです。
信頼度は、初期トレーニング データセットでアクティブ化された出力 0 と 1 の割合に対応します。
たとえば、トレーニング セットの 30% に出力 (1;0) があり、残りの 70% に出力 (0; 1) がある場合、信頼度 (0) = 30% および信頼度 (1) = 70% となります。