問題タブ [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - キャレット付きの予測区間
R のキャレット パッケージを使用してブースト回帰ツリーとランダム フォレスト モデルを実行してきましたが、組み込みの相互検証ルーチンを使用して一連の新しいケースの予測間隔を生成したいと考えています。
trainControl 関数を使用すると、n フォールドごとにホールドアウト予測を保存できますが、組み込み関数を使用して各フォールドで未知のケースも予測できるかどうか、または別の関数を使用する必要があるかどうか疑問に思っています。モデルを n 回構築するためのループ。
どんなアドバイスも大歓迎です
r - 切片なしモデルをキャレットに合わせる
R では、切片のないモデルを次のように指定します。
ただし、同じモデルをキャレットで適合させると、結果のモデルには切片が含まれます。
caret::train
インターセプト項を除外するにはどうすればよいですか?
r - キャレット内の rfe によって生成されたすべてのモデルにアクセスする
キャレット パッケージの関数を使用して、rfe
ロジスティック回帰モデルの機能選択を行っています。Rsquaredsizes
を使用して最適なモデルを選択するために、5、10、15、20、および 25 を調べています (私の従属変数は 0,1 です)。rfe
最終的に選択されたモデルを超えて、関数によって生成された他のモデルにアクセスする方法はありますか?
r - カレットを使用した完全に再現可能な並列モデル
カレットで2つのランダムフォレストを実行する場合、ランダムシードを設定するとまったく同じ結果が得られます。
ただし、モデリングを高速化するために並列バックエンドを登録すると、モデルを実行するたびに異なる結果が得られます。
この問題を解決する方法はありますか?1つの提案は、doRNGパッケージを使用することでしたがtrain
、現在サポートされていないネストされたループを使用します。
doSNOW
更新:この問題はとを使用して解決できると思いましclusterSetupRNG
たが、そこに到達することはできませんでした。
foreachの何が特別で、クラスターで開始したシードを使用しないのはなぜですか?オブジェクトa
とb
は同一なので、なぜそうではないmodel1
のmodel2
ですか?
r - それらのいくつかが要因である場合、機能を前処理する方法は?
私の質問は 、Caret パッケージを使用する場合のカテゴリ データ (R 用語の要因) に関するthis oneに関連しています。リンクされた投稿から、「数式インターフェイス」を使用すると、一部の機能が要因となり、トレーニングが正常に機能することがわかりました。preProcess()
私の質問は、関数を使用してデータをスケーリングするにはどうすればよいですか? 因子としていくつかの列を含むデータ フレームで実行しようとすると、次のエラー メッセージが表示されます。
ここでいくつかのサンプルコードを参照してください:
ありがとうございました。
r - Rカレット/rfe/bayesglm特徴選択
bayesglm
ロジスティック回帰の問題に使用しています。これは、150行と2000変数のデータセットです。私は変数選択を行おうとしていますが、通常はで調べglmnet
ますcaret::rfe
。ただし、のメソッドはありませんbayesglm
。
とにかく手動でメソッドを定義する方法はありrfe
ますか?
r - Rキャレット/rfe内の列車の交差検証はどのように機能しますか
ライブラリのrfe
機能について質問があります。caret
caret-homepageリンクでは、次の RFE アルゴリズムが提供
されています。
この例では、rfe
関数を 3 分割交差検証で使用し、train関数を線形 SVM と 5 分割交差検証で使用しています。
- 上記のアルゴリズムから、このアルゴリズムは 2 つのネストされた交差検証で機能すると仮定しました。
rfe
データ(150サンプル)を3つのフォールドに分割します- この
train
関数は、トレーニング セット (100 サンプル) で実行され、モデル パラメーターを調整するための 5 分割交差検証が行われ、その後の RFE が使用されます。
私を混乱させるのは、rfe
関数の結果を見ると、次のことです。
このことから、5 倍の cv からのトレーニング セットのサイズは、サイズが 80 であると予想される場合、120 サンプルであることがわかります。
したがって、誰かがrfeとtrainがどのように連携するかを明確にできれば幸いです。
乾杯
r - Rでのモデルの保存と読み込み
カレットを使用する場合、トレーニング後にモデルを保存し、後で(別のセッションなどで)予測のためにモデルをロードするにはどうすればよいですか?
r - カレットを使用した複数のモデルの予測の統計
パッケージcaretを使用して、さまざまなトレーニングモデルの予測の統計を取得しようとしています。以下は私の必要性を説明する例です:
pred
4つのモデルのX_kandY_から予測の統計(ROCなど)を取得するにはどうすればよいですか?
r - カレットおよびGBMエラー
caret
ユーザー定義のパフォーマンスメトリックを使用して、いくつかのネストされた相互検証プロセスにRのパッケージを使用しようとしています。私はさまざまな問題を抱えていたので、すぐに使用できる問題がないかどうかを確認するために引き返しましたが、問題が発生したcaret
ようです。
私が以下を実行した場合:
エラー(または同様の)が発生します:
{:タスク1のエラーが失敗しました-「引数は行数が異なることを意味します:619、381」
警告付き:
しかし、gbmルーチンだけを実行すると、すべてが正常に終了します。