1

X_sample に多数のサンプル行列 (mxn) があります。各行列には同じ数の行 (同じ m) がありますが、特徴の数は異なります (diff n)。X サンプルの行列の例は、1000x40、1000x35、1000x30、1000x25 です。私の質問について、次の(かなり単純化された)コード例があります。

Y_train =
Y_test =
clf = ExtraTreesClassifier(n_estimators=500, max_depth=None,max_features="auto",
                           min_samples_split=1, random_state=0)

for X_data in X_samples:
    X_train = X_data[0]
    X_test = X_data[1]
    clf.fit(X_train,Y_train)
    pred_res = clf.predict(X_test)
    .....

パラメータ を使用して、ループの外側に分類子を作成しますmax_features="auto"。さまざまな数の特徴を持つサンプル マトリックスを使用して、ループ内でさまざまな分類を実行します。私の質問はmax_features、ループがフィット操作を実行するたびに、分類器が X_train の実際のサイズ (フィーチャの実際の数) に基づいて の値を調整するかどうかです。値が「auto」のパラメータ max_featuresは、フィーチャ数の平方根に等しい実際の値を取得する必要があります。つまり、ループの外側またはループの内側で分類子を作成する必要がありますか? パラメータの実際の値を読み取る方法はありますmax_featuresか?

4

1 に答える 1

1

はい。このfit関数は推定量を変更しません。ドキュメントを参照してください。

于 2012-12-01T11:37:25.390 に答える