問題タブ [oversampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
9782 参照

machine-learning - Pyspark でのオーバーサンプリングまたは SMOTE

7 つのクラスがあり、レコードの総数は 115 で、このデータに対してランダム フォレスト モデルを実行したいと考えていました。しかし、データは高い精度を得るには十分ではありません。だから私はすべてのクラスにオーバーサンプリングを適用して、マジョリティクラス自体がより多くのカウントを取得し、それに応じてマイノリティを取得したいと考えました。これは PySpark で可能ですか?