不均衡なデータセットの imblearn ライブラリで SMOTE モジュールを使用する方法について簡単な質問があります。
DNN モデルをトレーニングするためのデータセットがあります。12442 個のサンプルがあり、各サンプルは 650*5 の配列です:
X.shape # (12442, 650, 5) y.shape # (12442, 1)
データセットは、tf.keras API で構築された私の DNN モデルでうまく機能します。
ただし、SMOTE でオーバー サンプリングを追加しようとすると、次のエラーが返されます。
from imblearn.over_sampling import SMOTE
sm = SMOTE()
X, y = sm.fit_sample(X, y)
ValueError: Found array with dim 3. Estimator expected <= 2.
imblearn パッケージの SMOTE は 1 次元データしか取得しないということですか? それを回避する方法または別のパッケージはありますか?