1

ニューラルネットワークを使用してマルチクラス分類を行っています。10 個のターゲット クラスと 1 個の null (上記以外のターゲット) があるとします。上記の場合に 10 個の個別のニューラル ネットワークまたは 11 個の出力を持つニューラル ネットワーク (10 個のターゲット、他 1 人)? さまざまな論文で 2 つのアプローチのいずれかを使用している人々を見てきましたが、説明はありませんでしたが、ターゲット クラスごとに個別のネットワークを使用することに理論的な優位性はありますか? 計算上のオーバーヘッド コストは、代替アプローチに関する利益と利益に見合う価値がありますか?

前もって感謝します!

PS(1)もちろん、どちらのアプローチでも、トレーニング例の分布は非ターゲット(「その他」)クラスに大きく偏っており、(2)NNの出力層にはソフトマックスアクティベーションがあると想定されています。

4

1 に答える 1

0

このような問題に対処できる可能性のある方法がいくつかあります。

個別のクラス出力を使用して単一のネットワークをトレーニングする

このアプローチはおそらくトレーニングと設計が最も速く、必要なクラス出力の数と同じ数の出力が得られます。反対に、トレーニング セット内の各クラスに十分なケースがあることを確認して、ニューラル ネットワークが特定のクラスを他のクラスより優先しないようにする必要があります。さらに、ネットワークは、次のケースのように個々のクラスに特化されません。

特定のクラスに特化したネットワークをトレーニングする

この場合、N 個のニューラル ネットワークは、おそらく半分が真で半分が偽のケースでトレーニングされます。各ニューラル ネットワークは、テスト データと、個々のネットワークの出力に基づいて選択されたクラスで評価されます。約 N 倍のトレーニングとトレーニング データの前処理がありますが、全体的に精度が向上する可能性もあります。計算コストが精度の向上によって正当化されるかどうかは設計者次第ですが、一般的には改善が見られるはずです。

密接に関連するクラスのグループでトレーニングするモジュラー ニューラル ネットワークを構築する

ここで、テスト ケースに最適と見なされるニューラル ネットワークに応じて、10 個のグループを 5 個ずつ 2 つのグループに分割することができます。ここでは、1 つのネットワークをトレーニングして専門のニューラル ネットワークを割り当て、他の 2 つのネットワークをトレーニングして特定のクラスを推定することができます。これは、上記の 2 つの中間点のようなものです。

他にも有効なアプローチはたくさんありますが、上記の質問に基づいて思い浮かぶ主な 3 つを紹介します。

于 2014-09-16T01:18:28.397 に答える