r - h2o.randomforestは欠損値をどのように処理しますか

Question

h2o に関する調査の結果、h2o.randomForest は R randomForest パッケージとは異なり、変数の欠損値を処理できることがわかりました。

しかし、どこを見ても、欠落している値がh2o.randomForestによってどのように処理されているかがわかりませんか? R gbm() パッケージによるミスイン値の処理とどの程度似ていますか?

上記の 2 つの質問に関するヘルプをいただければ幸いです。

ありがとう、

score 0 · Accepted Answer

H2O のドキュメントを参照して、DRF アルゴリズムがさまざまな状況で欠損値を処理する方法を確認できます: http://h2o-release.s3.amazonaws.com/h2o/rel-slater/5/docs-website/h2o-docs/ index.html#Data%20Science%20Algorithms-DRF-FAQ

R の GBM に関しては、NA を処理する準備が整ったツリーを作成します。つまり、NA を特別なケースとして明示的に処理します。R の GBM は、実際には NA を特別なケースとして扱い、それらのツリーブランチを構築します。左、右、NA はすべての決定の結果です。

お役に立てれば！

アヴニ

1 に答える 1