libsvm を使用してデータを分類しようとすると問題が発生します。私のトレーニング データとテスト データは非常にバランスが取れていません。svm パラメーターのグリッド検索を実行し、クラスの重みでデータをトレーニングすると、テストで 96.8113% の精度が得られます。しかし、テスト データが不均衡であるため、正しい予測値はすべて、陽性クラスよりも大きい陰性クラスからのものです。
重みの変更からガンマ値とコスト値の変更まで、多くのことを試しましたが、正規化された精度 (正のクラスと負のクラスを考慮に入れる) は試行ごとに低くなります。デフォルトの grid.py パラメータを使用してポジティブの 50% とネガティブの 50% をトレーニングすると、精度が非常に低くなります (18.4234%)。
問題が説明 (特徴ベクトルの作成方法) にあるのか、不均衡 (別の方法でバランス データを使用する必要がありますか?) にあるのか、それとも分類子を変更する必要があるのかを知りたいです。