1

1対すべてのアプローチを使用してトレーニングされたロジスティック回帰を使用して、マルチクラス分類器を作成しました。訓練された分類器の学習曲線をプロットしたいと思います。

学習曲線はクラスごとにプロットする必要がありますか、それとも分類器全体の単一のプロットにする必要がありますか? 違いはありますか?

明確にするために、学習曲線は、トレーニングと交差検証/テスト セットのエラー/コストとトレーニング セットのサイズをプロットしたものです。このプロットにより、トレーニング セットのサイズを大きくするとパフォーマンスが向上するかどうかを確認できます。より一般的には、学習曲線により、アルゴリズムがバイアス (フィッティング不足) または分散 (オーバーフィッティング) の問題に悩まされているかどうかを識別できます。

私のコードに関するいくつかの詳細:

  • MNISTの手書き数字画像を分析
  • 画像の数字 (0-9) を予測します
  • 機械学習に関する Andrew Ng の Coursera クラスに基づく
4

1 に答える 1

1

一般的に、私はすべてのものをプロットします。または、すべてを収集してプロットするスクリプトを作成します。

分類子プロット全体の必要性は明らかだと思います。しかし、クラスごとの問題は、単一のクラスから問題が発生していないことを確認するのに価値があると思います. たとえば、「5」がトレーニング データの増加に対して頑固に抵抗しているが、全体的な分類子はまだそれによって助けられている場合、さらにデータを注ぐ前に、その 1 つのクラスの状況を調査することをお勧めします。

于 2015-05-31T00:21:51.120 に答える