machine-learning - ニューラルネットワークの出力の解釈

Question

分類問題の場合、ネットワークの出力は通常どのように決定されますか?

たとえば、それぞれに数値識別子を持つ 3 つの可能なクラスがあるとします。妥当な解決策は、出力を合計し、その合計をネットワークの全体的な出力として取得することでしょうか? それとも、ネットワーク出力の平均を取りますか?

ANN 理論に関する情報はたくさんありますが、アプリケーションに関する情報はあまりありませんが、これがばかげた質問であれば申し訳ありません。

score 5 · Accepted Answer

3つのクラスを持つ多層パーセプトロン分類器の場合、通常、3つの出力を持つネットワークを構築し、ネットワークをトレーニングして、（1,0,0）が最初のクラスのターゲット出力、（0,1,0）が2番目のクラス、および3番目のクラスの場合は（0,0,1）。新しい観測値を分類するには、通常、最大値の出力を選択します（たとえば、（0.12、0.56、0.87）はクラス3として分類されます）。

score 0 · Accepted Answer

私は主に bogatron に同意します。さらに、ニューラルネットワークを使用したこの種の「マルチクラス分類」についてアドバイスしている多くの投稿がここにあります。

あなたの見出しに関して、私はこれの理論的根拠を見つけるのに苦労したので、その出力を確率として解釈できることを付け加えたいと思います. 続いて、出力層に 3 つのニューロン (それぞれのクラスに 1 を示す) を持つニューラルネットワークについて説明します。トレーニングでは 3 つの出力すべての合計が常に 1 になるため、ニューラルネットワークは合計 1 のフィードフォワード出力も提供します (つまり、bogatrons の例よりも (0.12 0.36 0.52))。それぞれの入力がクラス 1/2/3 に属する確率 (クラス 3 に属する確率は 0.52))。

これは、ロジスティック関数または tanh を活性化関数として使用する場合に当てはまります。

詳細: ニューラルネットワークによる事後確率: http://www-vis.lbl.gov/~romano/mlgroup/papers/neural-networks-survey.pdf
人工ニューラルネットワークの出力を確率に変換する方法は?

machine-learning - ニューラル ネットワークの出力の解釈

2 に答える 2

Related

Reference

machine-learning - ニューラルネットワークの出力の解釈