1

CART (Classification and Regression Tree) アルゴリズムで連続属性を分割する方法がわかりません。CART はカテゴリ属性と連続属性の両方を分割できることがわかっているためです。

私は多くの論文を読みましたが、分割ポイントになる値はシーケンスの中間値であると書かれています。私はそれについて理解していません。それが何を意味するのか説明して、いくつかの例を挙げてもらえますか?

ありがとう

4

1 に答える 1

1

一般的なプロセスは、指定された予測子の候補分割値をスキャンし、各分割の品質を測定して、最適なものを選択することです。効率のために、スキャンはすべての可能な分割を試行するのではなく、代わりにすべてのパーセンタイルまたはその他の縮小された選択肢のセットを試行します。分割の品質は、情報の獲得、ツーイングなど、さまざまな方法で測定できます。

Breiman、Friedman、Stone Olshen によって最初に記述された CART アルゴリズムについて具体的に話している場合は、彼らの本「Classification and Regression Trees」(1984) を確認してください。

于 2011-01-30T13:06:59.700 に答える