1

[1, 0, 0]私は、ラベルがor[0, 1, 0][0, 0, 1]typeなどのワンホット エンコードされたベクトルとしてエンコードされるマルチラベル予測タスクに取り組んでいますndarray

データセットが不均衡です。したがって、私は SMOTE を使用しています。これは機能し、すべての少数派クラスをアップサンプリングします (多数派クラスが保持するのと同じ数のレコードをアップサンプリングします)。

今、私はそれほど多くのレコードをアップサンプリングしたくありません。ドキュメントによると、およびsampling_strategyで dict を使用および提供できます。key = class labelvalue = total records

ただし、ndarrayas キーを dict ( TypeError: unhashable type: 'numpy.ndarray') に追加することはできません。ここで最善の方法は何ですか?SMOTE は明らかにこれらのワンホット エンコードされたベクトルを処理できtotal recordsます。

4

0 に答える 0