0

h2o に関する調査の結果、h2o.randomForest は R randomForest パッケージとは異なり、変数の欠損値を処理できることがわかりました。

http://h2o.ai/blog/2014/04/sjsu-tutorial-h2o-random-forest/を参照してください。

しかし、どこを見ても、欠落している値がh2o.randomForestによってどのように処理されているかがわかりませんか? R gbm() パッケージによるミスイン値の処理とどの程度似ていますか?

上記の 2 つの質問に関するヘルプをいただければ幸いです。

ありがとう、

4

1 に答える 1

0

H2O のドキュメントを参照して、DRF アルゴリズムがさまざまな状況で欠損値を処理する方法を確認できます: http://h2o-release.s3.amazonaws.com/h2o/rel-slater/5/docs-website/h2o-docs/ index.html#Data%20Science%20Algorithms-DRF-FAQ

R の GBM に関しては、NA を処理する準備が整ったツリーを作成します。つまり、NA を特別なケースとして明示的に処理します。R の GBM は、実際には NA を特別なケースとして扱い、それらのツリー ブランチを構築します。左、右、NA はすべての決定の結果です。

お役に立てれば!

アヴニ

于 2015-09-30T22:49:50.050 に答える