sklearn.datasets.make_classification では、クラス y はどのように計算されますか? 私が彼を実行するとしましょう:
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=1000, n_features=2, n_informative=2,
n_classes=2, n_clusters_per_class=1, random_state=0)
X から y を求めるには、どの式を使用しますか? ドキュメントでは、有益な機能について説明するときにこれに触れています。
有益な機能の数。各クラスは、次元 n_informative のサブスペース内のハイパーキューブの頂点の周りにそれぞれ配置された多数のガウス クラスターで構成されます。クラスターごとに、有益な特徴が N(0, 1) から独立して描画され、共分散を追加するためにランダムに線形結合されます。次に、クラスターはハイパーキューブの頂点に配置されます。
ありがとう、
G