4
Surrogate splits:
    ##       bmi    < 21.51 to the right, agree=0.858, adj=0.632, (0 split)

この分割では、bmi 値が 21.51 未満であることに基づいてケースが適切な子ノードに送信され、主要な変数 (同意 = 0.858) と同様の分割が行われ、ノードの不純物が適切に減少する (adj=0.632) ことを理解しています。

出力の (0 分割) 部分がわかりませんか? また、一致の値が 1 の場合、これは疑わしいでしょうか?

ありがとう!

4

1 に答える 1

4

たとえば、最初のプライマリ分割で 10 個が欠落している場合、rpart は代理分割を使用してそれらを分類しようとします。これらのうち 9 つが最初のサロゲート変数で欠落していない場合、rpart はこの変数を使用し、変数が 9 つの分割に使用されたため、このサロゲート変数の隣の rpart 出力に(9 つの分割)が表示されます。

サロゲート変数のデータも欠落している場合、出力には(0 分割)が含まれます。

一致の正確な計算はわかりませんが、一致1の場合、代理変数は主変数を使用した場合と同じ分類になると思います。これは、たとえば、代理変数が主変数のモノトーン変換バージョンである場合に発生する可能性があります。

于 2014-02-07T08:21:44.277 に答える