14

RパッケージのCover列が関数でどのように計算されるかを誰かが説明できますか?xgboostxgb.model.dt.tree

ドキュメントでは、Coverは「分割によって影響を受ける観測の数を測定するためのメトリックです」と記載されています。

xgboostこの関数のドキュメントに記載されている次のコードを実行するとCover、ツリー 0 のノード 0 は 1628.2500 になります。

data(agaricus.train, package='xgboost')

#Both dataset are list with two items, a sparse matrix and labels
#(labels = outcome column which will be learned).
#Each column of the sparse Matrix is a feature in one hot encoding format.
train <- agaricus.train

bst <- xgboost(data = train$data, label = train$label, max.depth = 2,
               eta = 1, nthread = 2, nround = 2,objective = "binary:logistic")

#agaricus.test$data@Dimnames[[2]] represents the column names of the sparse matrix.
xgb.model.dt.tree(agaricus.train$data@Dimnames[[2]], model = bst)

列車のデータセットには 6513 の観測があるのでCover、ツリー 0 のノード 0 がこの数の 4 分の 1 (1628.25) である理由を誰か説明できますか?

また、Coverツリー 1 のノード 1 は 788.852 です。この数値はどのように計算されますか?

どんな助けでも大歓迎です。ありがとう。

4

1 に答える 1