RパッケージのCover
列が関数でどのように計算されるかを誰かが説明できますか?xgboost
xgb.model.dt.tree
ドキュメントでは、Coverは「分割によって影響を受ける観測の数を測定するためのメトリックです」と記載されています。
xgboost
この関数のドキュメントに記載されている次のコードを実行するとCover
、ツリー 0 のノード 0 は 1628.2500 になります。
data(agaricus.train, package='xgboost')
#Both dataset are list with two items, a sparse matrix and labels
#(labels = outcome column which will be learned).
#Each column of the sparse Matrix is a feature in one hot encoding format.
train <- agaricus.train
bst <- xgboost(data = train$data, label = train$label, max.depth = 2,
eta = 1, nthread = 2, nround = 2,objective = "binary:logistic")
#agaricus.test$data@Dimnames[[2]] represents the column names of the sparse matrix.
xgb.model.dt.tree(agaricus.train$data@Dimnames[[2]], model = bst)
列車のデータセットには 6513 の観測があるのでCover
、ツリー 0 のノード 0 がこの数の 4 分の 1 (1628.25) である理由を誰か説明できますか?
また、Cover
ツリー 1 のノード 1 は 788.852 です。この数値はどのように計算されますか?
どんな助けでも大歓迎です。ありがとう。