[1, 0, 0]
私は、ラベルがor[0, 1, 0]
や[0, 0, 1]
typeなどのワンホット エンコードされたベクトルとしてエンコードされるマルチラベル予測タスクに取り組んでいますndarray
。
データセットが不均衡です。したがって、私は SMOTE を使用しています。これは機能し、すべての少数派クラスをアップサンプリングします (多数派クラスが保持するのと同じ数のレコードをアップサンプリングします)。
今、私はそれほど多くのレコードをアップサンプリングしたくありません。ドキュメントによると、およびsampling_strategy
で dict を使用および提供できます。key = class label
value = total records
ただし、ndarray
as キーを dict ( TypeError: unhashable type: 'numpy.ndarray'
) に追加することはできません。ここで最善の方法は何ですか?SMOTE は明らかにこれらのワンホット エンコードされたベクトルを処理できtotal records
ます。