1

R でランダム フォレストを使用してモデルを開発しています。データには 2000 個の obs x 20 個の特徴があります。分類しようとしている対象クラスには 6 つのレベルがあります。すべての変数は本質的にカテゴリカルです。

ターゲットは、観測値の 65% 以上を構成する 1 つのクラスに偏っています。残りの 35% は、他の 5 つのターゲット クラスに分配されます。配布は以下の通り

Class A       Class B       Class C    Class D     Class E        Class F       Class G
0.660185185    0.002314815  0.0027777  0.0722222   0.181944444    0.013425926   0.067129630 

ROSE または SMOTE を使用してデータ セットのバランスを取ろうとしていますが、バイナリ分類子でのみ機能するというエラーが発生します。

マルチクラス データ セットのバランスを取るために R で利用できるライブラリはありますか。現在、モデルの精度は非常に低くなっています (約 64%)。データセットのバランスをとることで精度が向上することを願っています。

この問題の助けをいただければ幸いです。

乾杯 -ニティン

4

0 に答える 0