問題タブ [imbalanced-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
368 参照

embedding - rasa nlu データの不均衡問題に対処するには?

今、私は識別する 12 の意図を持っています。,しかし、各意図のデータの量は一貫していません。,会議の設定のように、これらの意図を思い出させると、データの量は数千になります。しかし、挨拶のように、そのような意図をありがとう、非常に少数です。データ サンプルは、おそらく数十個です。

このデータの不均衡の問題にどのように対処すればよいですか?

私の config.yml ファイルの内容は次のとおりです。

0 投票する
2 に答える
431 参照

keras - Keras のカスタム損失関数 (焦点損失) 入力サイズ エラー

ニュートラルネットワークを使用してマルチクラス分類を行っています。アンバランスなクラスが 3 つあるので、フォーカル ロスを使用してインバランスを処理したいと考えています。そこで、Keras シーケンシャル モデルに適合するようにカスタム損失関数を使用します。オンラインで見つけたフォーカルロス関数のコードの複数のバージョンを試しましたが、同じエラーメッセージが返されます。基本的に、入力サイズはバスサイズですが、期待される1であると言っています。修理する?ほんとうにありがとう!!!

</p>

# fit the model (train for 5 epochs) history = model.fit(x=x_train, y=y_train, batch_size=64, epochs=5, class_weight = class_weight)

0 投票する
1 に答える
919 参照

r - RのROSEでのオーバーサンプリングとアンダーサンプリングの問題

勝訴 (14399) と敗訴 (8677) を分類するためのデータセットがあります。データセットには 912 個の予測変数があります。勝ったケースとほぼ同じ数に到達するために、負けたケースをオーバーサンプリングしようとしています (つまり、勝ったケースと負けたケースのそれぞれに 14399 ケースがあります)。

TARGET は、負けた (0) ケースと勝った (1) ケースの列です。

今、ROSE ovun.sample を使用してそれらのバランスをとろうとしています

次のエラーが表示されます。

誰でも助けることができますか?ありがとう :-)