問題タブ [cart-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rpart "Error in as.character(x) : cannot coerce type 'builtin' to vector of type 'character'" というメッセージはどういう意味ですか?
私はrpart
数日間頭を悩ませてきました(私が持っているこのデータセットの分類ツリーを作成しようとしています)、そしてこの時点でライフラインに尋ねる時が来たと思います:-)それはばかげたことだと確信しています私は見ていませんが、これが私がやっていることです:
私の人生では、エラーが何であるかを理解できません。
r - 「anova」(lmの場合)はrpartオブジェクトと同等ですか?
Rのrpart
関数を使用すると、モデルを簡単に適合させることができます。例えば:
私の質問は、モデルに対する3つの説明変数(年齢、数、開始)のそれぞれの「重要性」をどのように測定できますか?
これが回帰モデルである場合、「分散分析」F検定(lm
変数があるモデルとないモデルの間)からのp値を調べることができます。lm
しかし、rpart
オブジェクトに「分散分析」を使用することと同等ですか?
(私は私の質問を明確にすることができたと思います)
ありがとう。
r - Rで分類木を構築するときに、因子変数のrpart分割をどのように解釈しますか?
因子変数が気候で、4 つの値 (熱帯、乾燥、温帯、雪) があり、rpart
ツリーのノードに「Climate:ab」というラベルが付いている場合、分割は何ですか?
r - rpart を使用して回帰木で対応するノードを検索する
私はRにかなり慣れていないので、かなりばかげた問題に悩まされています。
分類と予測を行うために、 rpartパッケージを使用して回帰ツリーを調整しています。
R のおかげで、キャリブレーション部分は簡単に実行でき、制御も簡単です。
大きなデシジョン ツリーを調整した後、特定のデータ サンプルに対して、対応する新しいデータのクラスター (したがって予測値) を見つけたいと考えています。機能はニーズにぴったりのようです
。predict
ただし、この方法では、新しい要素の予測比率を取得するだけで、新しい要素が属する決定木の葉predict
を取得する方法が見つかりません。
比率を返すには、予測メソッドがその葉を見つけたに違いないので、取得するのはかなり簡単だと思います。
引数を介して predict メソッドに与えることができるいくつかのパラメーターがありますがclass=
、回帰ツリーの場合、すべて同じもの (決定ツリーのターゲット属性の値) を返すようです。
決定木で対応するノードを取得する方法を知っている人はいますか?
メソッドを使用してノードを分析することでpath.rpart
、結果を理解するのに役立ちます。
r - NAを処理できるRパッケージ/モデル
NAのインスタンスがある行または列を無視するのではなく、NAを処理できるRパッケージまたは機械学習モデル/アルゴリズム( 、、、などrandomForest
)を探しています。私は帰属するつもりはありません。助言がありますか?glmnet
gbdt
r - 強制構造の決定木
私は、rpartパッケージを使用してRの決定木(CART)を使用して、SST(予測変数)と気候(予測変数)の関係を調べています。
ツリーを特定の構造に「強制」したいと思います。つまり、予測変数1で分割し、次に変数2で分割します。
私はしばらくの間Rを使用しているので、rpart関数の背後にあるコードを調べて、特定の予測変数で「最良の分割」を最初に検索するように変更できると思いました。ただし、rpart関数はCルーチンを呼び出し、CIの経験がない場合はここで失われます...
関数を最初から作成することもできますが、可能であれば避けたいと思います。だから私の質問は:
- ツリーの構造を強制できる別の決定木手法(できればRで実装)はありますか?
- そうでない場合-CコードをRに変換する方法はありますか?
- 他のアイデアはありますか?
よろしくお願いします。助けていただければ幸いです。
r - R: 予測因子に 52 を超える水準があり、印刷用に切り捨てられています
こんにちは、R プログラミング言語の初心者です。rpart パッケージを使用して回帰木のコードを 1 つ書きました。私のデータでは、いくつかの独立変数が 100 を超えるレベルを持っています。rpart関数を実行した後、次の警告メッセージが表示されます「予測因子に52レベル以上あり、印刷用に切り捨てられました」&ツリーが非常に奇妙な方法で表示されます。たとえば、ツリーが約 70 の異なるレベルを持つ場所によって分割されているとしますが、ラベルがツリーに表示されると、場所がない場所に「ZZZZZZZZZZZZZZZZ.....」と表示されます。 「ZZZZZZZZ」と呼ばれる
私を助けてください。
前もって感謝します。
r - 二分決定木(CART)の分割とルートノード
回帰ツリーで分割ノードとルート ノードを見つける方法、複数のベクトルから回帰ツリーを作成したので、複数のベクトルのrpart のルート ノードを抽出する必要があります。ファイルには、複数のベクトルA
の数値が含まれています。ベクトルには 4,3,6,7,2,4,5 などが含まれ、同様に他の B、C、D、E、F、G、H も含まれます。私の場合)ツリーを作成した後、この入力からの出力として。ありがとうございます。申し訳ありませんが、画像を配置できません:(B
C
D
E
F
G
H
F
これが私がこれまでに行ったことです
.........今F(F>=5.5)
、フィット (回帰木) とその分割からルート ノードを抽出する必要があります。
r - rpartのデータを作成する
rpart
リストの列名を連結して、 ?の式を準備します。
名前(log_data)を連結したかったのは、60個のベクトルの異なるベクトルのリストなのでlog_data
、列名をr .....のrpartの式に入れることができる形式で、列名が必要です。rpart(A ~ B + C + D + E ,log_data)
ここでは、formula = "A〜B + C + D + E"を文字列全体として抽出したいだけです。ここで、A、B、C、D、Eは、log_dataから抽出する必要のある列名です。リストからツリーを取得するためのより良い方法。
私が試してみました、
エラーが発生する
どこ
列名が長すぎるか、n = 60である可能性があるため、rpartで無限ループになります。
任意の列名を添付できますかcolnames(log_data)<-c(?)、n = 60で簡単に描画できるように、「?」に何を入力すればよいですか。