ndarray 内の各データポイントの要素数をカウントするにはどうすればよいですか?
私がやりたいことは、ndarray に少なくとも N 回存在するすべての値に対して OneHotEncoder を実行することです。
また、出現回数が N 回未満のすべての値を、配列に出現しない別の要素 (new_value と呼びましょう) に置き換えたいと考えています。
たとえば、私は持っています:
import numpy as np
a = np.array([[[2], [2,3], [3,34]],
[[3], [4,5], [3,34]],
[[3], [2,3], [3,4] ]]])
しきい値 N=2 の場合、次のようなものが必要です。
b = [OneHotEncoder(a[:,[i]])[0] if count(a[:,[i]])>2
else OneHotEncoder(new_value) for i in range(a.shape(1)]
したがって、onehotencoder を考慮せず、new_value=10 を使用するのではなく、必要な置換を理解するためだけに、配列は次のようになります。
a = np.array([[[10], [2,3], [3,34]],
[[3], [10], [3,34]],
[[3], [2,3], [10] ]]])