私はバイナリデータ分類の問題に取り組んでいます。データセットは不均衡で、92% の「偽」ラベルと 8% の「真」ラベルで構成されています。特徴の数は 18 で、少数の 650 のデータ ポイントがあります。この問題を解決するために、「GentleBoost」のような matlab のブースティング アルゴリズムを使用したいと考えています。次のように事前に制服を割り当てます。
ada = fitensemble(Xtrain,Ytrain,'GentleBoost',10,'Tree','LearnRate',0.1,'prior', 'uniform');
しかし、パフォーマンスは一貫して悪いです。パラメータはどのように設定すればよいですか? 費用の設定は必要ですか?どうすればこれを行うことができますか?これよりも優れたパフォーマンスの分類子はありますか?