問題タブ [rpart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 警告メッセージ: rpart を使用したキャレット train() の「リサンプリングされたパフォーマンス測定値に値がありません」
「rpart」パッケージでモデルをトレーニングするためにキャレットパッケージを使用しています。
データには欠損値や NA はありませんが、コマンドを実行すると警告メッセージが表示されます。
この警告の意味を知っている人はいますか (または答えを見つける場所を教えてくれますか)。リサンプリングされたパフォーマンス測定値に欠損値があったことを私に伝えていることは知っていますが、それは正確には何を意味し、どのようにしてそのような状況が発生するのでしょうか? ところで、predict()
関数は適合モデルで正常に動作するので、それは私の好奇心です。
r - プロット全体が表示されない rpart を含むカート
rpart を使用して分類ツリーをプロットしようとしていますが、R にすべての変数が含まれていません。20 個のケースと 200 個の変数があります。私のデータは次のようになります。
ただし、x1 + x2 +x3 .... + x200 の場合。
私の変数値はすべてこれに似ています。非常に小さく、平均が 0.0005 前後のものもあります。分類木が必要で、y はバイナリなので、 method = "class" が必要です。
入力すると
私は得る:
x50に従ってのみ分割する理由がわかりません。何が起こっているのかをプロットしてみました。
次のプロットを取得しました: http://i.imgur.com/cCTa69a.png
何が起こっているのか、またはどうすればこれを修正できますか? とても有難い。
r - rpartを使用してカテゴリ変数を持つ分類ツリーを構築する
私は14の機能を持つデータセットを持っています.性別と婚姻状況がカテゴリ変数である以下のようなものはほとんどありません.
現在、R の rpart ライブラリを使用して、次を使用して分類ツリーを構築しています。
これにより、性別や婚姻状況を要因として考慮しない決定木が得られます。
私はこれに as.factor を使用することを考えています:
しかし、この情報を rpart に渡す方法がわかりません。rpart() の data 引数は「trainingData」データ フレームを取り込むためです。このデータ フレームにある値を常に取得します。私はRに少し慣れていないので、これについて誰かの助けをいただければ幸いです。
r - as.party 関数では、どのノードが異なるノードのインデックスであるかを明確にするにはどうすればよいですか?
rpart で CART を作成した後、partykit パッケージの as.party 関数を使用して、CART を party オブジェクトに変換します。次のエラーが表示されます。
as.party(tree.hunterpb1)
インデックスは因子に適用されるため、文献から理解したように、因子変数によって行われた分割を参照しているとしか思えません。私のツリーは次のようになります。
ツリー.hunterpb1 n= 354
トレースバックは、パーティ クラスへの最初のパーティションの変換が正しく行われたが、因子変数に基づく 2 番目の変換が失敗し、上記のエラーが発生したことを示しています。
以前は同様のデータを扱っていた場合、このエラーは発生しませんでした。as.party 関数がインデックスを見つけていないとしか思えません。これを解決する方法についてのアドバイスをいただければ幸いです。
r - R の分類ツリーにルールを手動で追加する方法
R の rpart および tree パッケージを使用して 2 つの分類木を当てはめました。当てはめられた木の 1 つにルールを手動で追加したいと思います。これを行う方法はありますか?
これは、私が達成したいことの例です (記事A Brief Tour of the Trees and Forestsから取得)。
これは、当てはめられたツリーがどのように見えるかです:
さて、何らかの理由で (つまり、私の予備知識または別のデータ セットの別の適合ツリーに基づいて)、NM への応答を Koc<5 に設定したいとします。この情報は、上記のツリーのフィッティングに使用されるトレーニング セットに含まれていないため、どのようにそれを組み込むことができますか?
r - R キャレット パッケージ (rpart): 分類木の構築
キャレット パッケージを使用して分類ツリーを実行するのに数日間苦労しています。問題は私の因子変数です。ツリーを生成しますが、最適なモデルを使用してテスト サンプルを予測しようとすると失敗します。これは、train 関数が因子変数のダミーを作成し、予測関数がこれらの新しく作成されたダミーをテスト セットで見つけることができないためです。 . この問題にどう対処すればよいですか?
私のコードは次のとおりです。
トレーニング/テスト用の str() 関数のサンプルを以下に示します。
次に、私のコードは次のようになります。
のサンプル
ここにある
そして、ここにエラーがあります:
model.tree1 <- predict(tree1$finalModel,testing) eval(expr、envir、enclos) のエラー: オブジェクト 'sect_isodev1' が見つかりません
私はまだ別のことに興味があります。Max Kuhn の "Predictive Modeling with R" で、次の構文を見つけました。
ここrpartTune$finalModel
で、私のものと同一の分類木 (または私のものと同一のもの) を分類します。現在、R は type="class" を受け入れません。type="prob" のみ。そのせいで困っています。
ご回答ありがとうございます。
r - RでGBMツリーをrpartまたはctreeに変換する方法は?
gbm パッケージで得られた木 (関数で抽出) を決定木構築 (または)pretty.gbm.tree
に関するオブジェクトに変換する方法を知っていますか?rpart
ctree
r - 各ノードの決定木からパーセンテージを取得する方法
以下のプロットの各ノードのパーセンテージを含むテーブルを作成するにはどうすればよいですか?
次のプロットが得られます。
最初の列として種を、2 番目の列の各ノードに関連するパーセントを含むテーブルを出力したいと思います。テーブルの 2 回目の繰り返しでは、最初のノード (100%) が除外され、より高いパーセンテージを含む行を保持することで重複が削除されます。
「rpart」のドキュメントを読んでも、このテーブルの作成方法がわかりません。ご意見をお聞かせください。
お時間をいただきありがとうございます。
r - 「cegh」の代わりに適切な国を表示するにはどうすればよいですか?
R の初心者として、提供された「car.test.frame」データセットを使用して、国に基づいて走行距離を予測する分類ツリーを作成します。入力したコマンドは次のとおりです。
これにより、次のツリーが作成されました。
ご覧のとおり、最上位レベルでは、Country=cegh が最初の分割を提供し、Country=egh が 2 番目の分割を提供します。実際の国名を反映するように変更するにはどうすればよいですか? そして、実際にチャートをどのように理解するのでしょうか?