問題タブ [oversampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2160 参照

python - パイプラインでテキスト (不均衡なグループ) をリサンプリングする方法は?

MultinomialNB を使用してテキスト分類を行おうとしていますが、データのバランスが取れていないために問題が発生しています。(以下は簡単にするためのサンプル データです。実際には、私のデータはもっと大きいです。) オーバー サンプリングを使用してデータをリサンプリングしようとしています。理想的には、このパイプラインに組み込みたいと考えています。

以下のパイプラインはオーバーサンプリングしなくても問題なく動作しますが、実際のデータではそれが必要です。とてもアンバランスです。

この現在のコードでは、「TypeError: すべての中間ステップはトランスフォーマーであり、フィットとトランスフォームを実装する必要があります」というエラーが発生し続けます。

このパイプラインに RandomOverSampler を組み込むにはどうすればよいですか?