分類問題の場合、ネットワークの出力は通常どのように決定されますか?
たとえば、それぞれに数値識別子を持つ 3 つの可能なクラスがあるとします。妥当な解決策は、出力を合計し、その合計をネットワークの全体的な出力として取得することでしょうか? それとも、ネットワーク出力の平均を取りますか?
ANN 理論に関する情報はたくさんありますが、アプリケーションに関する情報はあまりありませんが、これがばかげた質問であれば申し訳ありません。
分類問題の場合、ネットワークの出力は通常どのように決定されますか?
たとえば、それぞれに数値識別子を持つ 3 つの可能なクラスがあるとします。妥当な解決策は、出力を合計し、その合計をネットワークの全体的な出力として取得することでしょうか? それとも、ネットワーク出力の平均を取りますか?
ANN 理論に関する情報はたくさんありますが、アプリケーションに関する情報はあまりありませんが、これがばかげた質問であれば申し訳ありません。
3つのクラスを持つ多層パーセプトロン分類器の場合、通常、3つの出力を持つネットワークを構築し、ネットワークをトレーニングして、(1,0,0)が最初のクラスのターゲット出力、(0,1,0)が2番目のクラス、および3番目のクラスの場合は(0,0,1)。新しい観測値を分類するには、通常、最大値の出力を選択します(たとえば、(0.12、0.56、0.87)はクラス3として分類されます)。
私は主に bogatron に同意します。さらに、ニューラル ネットワークを使用したこの種の「マルチクラス分類」についてアドバイスしている多くの投稿がここにあります。
あなたの見出しに関して、私はこれの理論的根拠を見つけるのに苦労したので、その出力を確率として解釈できることを付け加えたいと思います. 続いて、出力層に 3 つのニューロン (それぞれのクラスに 1 を示す) を持つニューラル ネットワークについて説明します。トレーニングでは 3 つの出力すべての合計が常に 1 になるため、ニューラル ネットワークは合計 1 のフィード フォワード出力も提供します (つまり、bogatrons の例よりも (0.12 0.36 0.52))。それぞれの入力がクラス 1/2/3 に属する確率 (クラス 3 に属する確率は 0.52))。
これは、ロジスティック関数または tanh を活性化関数として使用する場合に当てはまります。
詳細: ニューラル ネットワークによる事後確率: http://www-vis.lbl.gov/~romano/mlgroup/papers/neural-networks-survey.pdf
人工ニューラル ネットワークの出力を確率に変換する方法は?