私はnumpyを初めて使用し、サンプルのサブセットをフィルタリングしようとして問題が発生します。
形の行列があります(1000, 12)
。つまり、それぞれに12個のデータ列がある1000個のサンプルです。2つの行列を作成します。1つはサンプル内のすべての外れ値を含み、もう1つは外れ値ではないすべての要素を含みます。結果の行列は次の形状になります。
norm.shape = (883, 12)
outliers.shape = (117, 12)
外れ値を特定するために、次の条件を使用しています。
cond_out = (dados[0:,RD_EVAL] > _max_rd) | (dados[0:,DUT_EVAL] > _max_dut)
つまり、マトリックスの各行について、2つの列の値を探しています。それらの1つが特定のしきい値を超えている場合、その線は外れ値と見なされます。重要なのは、この条件には形(1000,)
があるので、元の行列を圧縮すると(117,)
結果が得られるということです。(117,12)
結果が外れ値であるが、各行にすべてのデータ列がある行列になるように、行列をフィルター処理するにはどうすればよいですか?