numpy 配列の 17 個のフィーチャのそれぞれに 5000 個のデータ ポイントがあり、5000 x 17 配列になります。ガウス混合を使用して各機能の外れ値を見つけようとしていますが、次の点でかなり混乱しています: 1) GaussiasnMixture にはいくつのコンポーネントを使用する必要がありますか? 2) GaussianMixture を 5000 x 17 の配列に直接合わせる必要がありますか、それとも各機能列に個別に合わせて 17 の GaussianMixture モデルにする必要がありますか?
clf = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array)
また
clf = mixture.GaussianMixture(n_components=17, covariance_type='full')
clf.fit(full_feature_array)
また
for feature in range(0, full_feature_matrix):
clf[feature] = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(full_feature_array[:,feature)