オーバーフィッティングとその解決方法について説明している記事はたくさんあります。一般的な定義は
オーバーフィッティングは、精度や損失などの検証メトリクスをチェックすることで識別できます。検証メトリクスは、通常、モデルがオーバーフィッティングの影響を受けると、停滞するか低下し始めるポイントまで増加します。上昇傾向の間、モデルは良好な適合を求めます。これが達成されると、傾向が低下または停滞し始めます。
質問: オーバーフィッティングを判断するために、検証の精度と損失のみを考慮すべきですか?
私の場合、IEMOCAP データセットを使用しています。最終的なメトリックは次のようになります。
precision recall f1-score support
ang 0.48 0.45 0.46 170
hap 0.55 0.24 0.34 442
neu 0.42 0.56 0.48 384
sad 0.46 0.69 0.55 245
accuracy 0.46 1241
macro avg 0.48 0.48 0.46 1241
weighted avg 0.48 0.46 0.44 1241
混同メトリクスはこのようなものです
この混同メトリクスは、他の実験結果と比較すると良いように思えます。しかし、私の精度と損失のグラフは明らかにオーバーフィッティングを示しています。
では、オーバーフィッティングをどのように判断するのでしょうか? 考慮すべき他のパラメータは何ですか?