0

scikit Learn (python) を使用してランダム フォレスト (この場合はリグレッサー) モデルをトレーニングしました。使用した推定量に基づいて検証セットにエラー率をプロットしたいと思います。言い換えれば、RandomForestRegressor の推定量の一部のみを使用して予測する方法はありますか?

predict(X) を使用すると、すべての単一ツリー結果の平均に基づいて予測が得られます。木の使用を制限する方法はありますか? それとも最終的に、フォレスト内の各ツリーの各出力を取得しますか?

4

2 に答える 2

2

cohozのおかげで、私はそれを行う方法を理解しました。テストセットでランダムフォレストリグレッサーの学習曲線をプロットするときに便利であることが判明したdefをいくつか書きました。

## Error metric
import numpy as np
def rmse(train,test):
    return np.sqrt(np.mean(pow(test - train+,2)))

## Print test set error
## Input the RandomForestRegressor, test set feature and test set known values
def rfErrCurve(rf_model,test_X,test_y):
    p = []
    for i,tree in enumerate(rf_model.estimators_):
                p.insert(i,tree.predict(test_X))
                print rmse(np.mean(p,axis=0),test_y)
于 2013-04-10T23:54:25.823 に答える