問題タブ [r-caret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1691 参照

r - キャレット付きの予測区間

R のキャレット パッケージを使用してブースト回帰ツリーとランダム フォレスト モデルを実行してきましたが、組み込みの相互検証ルーチンを使用して一連の新しいケースの予測間隔を生成したいと考えています。

trainControl 関数を使用すると、n フォールドごとにホールドアウト予測を保存できますが、組み込み関数を使用して各フォールドで未知のケースも予測できるかどうか、または別の関数を使用する必要があるかどうか疑問に思っています。モデルを n 回構築するためのループ。

どんなアドバイスも大歓迎です

0 投票する
2 に答える
3094 参照

r - 切片なしモデルをキャレットに合わせる

R では、切片のないモデルを次のように指定します。

ただし、同じモデルをキャレットで適合させると、結果のモデルには切片が含まれます。

caret::trainインターセプト項を除外するにはどうすればよいですか?

0 投票する
1 に答える
924 参照

r - キャレット内の rfe によって生成されたすべてのモデルにアクセスする

キャレット パッケージの関数を使用して、rfeロジスティック回帰モデルの機能選択を行っています。Rsquaredsizesを使用して最適なモデルを選択するために、5、10、15、20、および 25 を調べています (私の従属変数は 0,1 です)。rfe最終的に選択されたモデルを超えて、関数によって生成された他のモデルにアクセスする方法はありますか?

0 投票する
3 に答える
21574 参照

r - カレットを使用した完全に再現可能な並列モデル

カレットで2つのランダムフォレストを実行する場合、ランダムシードを設定するとまったく同じ結果が得られます。

ただし、モデリングを高速化するために並列バックエンドを登録すると、モデルを実行するたびに異なる結果が得られます。

この問題を解決する方法はありますか?1つの提案は、doRNGパッケージを使用することでしたがtrain、現在サポートされていないネストされたループを使用します。

doSNOW更新:この問題はとを使用して解決できると思いましclusterSetupRNGたが、そこに到達することはできませんでした。

foreachの何が特別で、クラスターで開始したシードを使用しないのはなぜですか?オブジェクトabは同一なので、なぜそうではないmodel1model2ですか?

0 投票する
2 に答える
13304 参照

r - それらのいくつかが要因である場合、機能を前処理する方法は?

私の質問は 、Caret パッケージを使用する場合のカテゴリ データ (R 用語の要因) に関するthis oneに関連しています。リンクされた投稿から、「数式インターフェイス」を使用すると、一部の機能が要因となり、トレーニングが正常に機能することがわかりました。preProcess()私の質問は、関数を使用してデータをスケーリングするにはどうすればよいですか? 因子としていくつかの列を含むデータ フレームで実行しようとすると、次のエラー メッセージが表示されます。

ここでいくつかのサンプルコードを参照してください:

ありがとうございました。

0 投票する
1 に答える
1657 参照

r - Rカレット/rfe/bayesglm特徴選択

bayesglmロジスティック回帰の問題に使用しています。これは、150行と2000変数のデータセットです。私は変数選択を行おうとしていますが、通常はで調べglmnetますcaret::rfe。ただし、のメソッドはありませんbayesglm

とにかく手動でメソッドを定義する方法はありrfeますか?

0 投票する
1 に答える
3521 参照

r - Rキャレット/rfe内の列車の交差検証はどのように機能しますか

ライブラリのrfe機能について質問があります。caretcaret-homepageリンクでは、次の RFE アルゴリズムが提供 されています。

この例では、rfe関数を 3 分割交差検証で使用し、train関数を線形 SVM と 5 分割交差検証で使用しています。

  • 上記のアルゴリズムから、このアルゴリズムは 2 つのネストされた交差検証で機能すると仮定しました。
    1. rfeデータ(150サンプル)を3つのフォールドに分割します
    2. このtrain関数は、トレーニング セット (100 サンプル) で実行され、モデル パラメーターを調整するための 5 分割交差検証が行われ、その後の RFE が使用されます。

私を混乱させるのは、rfe関数の結果を見ると、次のことです。

このことから、5 倍の cv からのトレーニング セットのサイズは、サイズが 80 であると予想される場合、120 サンプルであることがわかります。

したがって、誰かがrfetrainがどのように連携するかを明確にできれば幸いです。

乾杯

0 投票する
3 に答える
36427 参照

r - Rでのモデルの保存と読み込み

カレットを使用する場合、トレーニング後にモデルを保存し、後で(別のセッションなどで)予測のためにモデルをロードするにはどうすればよいですか?

0 投票する
1 に答える
1553 参照

r - カレットを使用した複数のモデルの予測の統計

パッケージcaretを使用して、さまざまなトレーニングモデルの予測の統計を取得しようとしています。以下は私の必要性を説明する例です:

pred4つのモデルのX_kandY_から予測の統​​計(ROCなど)を取得するにはどうすればよいですか?

0 投票する
2 に答える
4128 参照

r - カレットおよびGBMエラー

caretユーザー定義のパフォーマンスメトリックを使用して、いくつかのネストされた相互検証プロセスにRのパッケージを使用しようとしています。私はさまざまな問題を抱えていたので、すぐに使用できる問題がないかどうかを確認するために引き返しましたが、問題が発生したcaretようです。

私が以下を実行した場合:

エラー(または同様の)が発生します:

{:タスク1のエラーが失敗しました-「引数は行数が異なることを意味します:619、381」

警告付き:

しかし、gbmルーチンだけを実行すると、すべてが正常に終了します。