SVMを使用して多クラス分類を行っています。フィーチャを [0,1] にスケーリングし、LIBSVM ガイドで提案されているように、グリッド検索を使用してパラメーター C とガンマを見つけました。これには 10 分割の交差検証を使用します。
しかし、得られたパラメータは非常に奇妙なものでした。C は非常に大きい (2^15)。
最初は、モデルが過適合ではないかと疑っていました。トレーニング/検証/テストの間にグラフをプロットすると、奇妙に見えました。C が大きいほど、得られた誤差は小さくなります (これは予想されることです)。しかし、トレーニング/検証/テストの違いは、C の違いに関係なく、どこまでも小さいです (C が小さいときは小さく、C が大きくなると大きくなるはずですよね)。
それで、何が起こっているのかわかりませんか?運動不足?オーバーフィット?それとも私のデータに何か問題があるのでしょうか? 何かご意見は?
君たちありがとう!
ルーシー