問題タブ [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - キャレットの「train」関数に新しいメソッドを追加する
RSNSS (Stuttgart Neural Network Simulator) でキャレットを使用してモデルをトレーニングしたいと考えています。残念ながら、RSNSS はまだトレインに実装されていないようです。新しいメソッドを追加するための train 関数のドキュメントはないようです。他の誰かがこれを自分で試したのではないかと思っていました。
rsnss オブジェクトには 'train' と 'predict' の両方のメソッドが既に定義されているので、これはそれほど難しくないと思います。
ありがとうございました。
/edit: Caret に RSNSS パッケージのメソッドが含まれるようになりました。
r - キャレットトレインが大量のメモリを消費するのはなぜですか?
を使用してトレーニングするとglm
、すべてが機能し、メモリを使い果たすことさえありません。しかし、train(..., method='glm')
実行するとメモリが不足します。
これtrain
は、クロス検証の反復ごとに大量のデータを保存しているためですか (または trControl プロシージャが何であれ)? 私は見てtrainControl
いますが、これを防ぐ方法が見つかりません...ヒントはありますか?私が気にするのは、パフォーマンスの概要と、おそらく予測された応答だけです。
(glmのグリッドがないため、パラメーター調整グリッド検索の各反復からのデータの保存に関連していないことはわかっています。)
r - 時系列クロス検証を使用して createFolds を模倣する
R パッケージの caret は、相互検証で使用されるトレーニング セットのインデックスのリストを返す便利な関数createFoldsを提供します。
時系列の相互検証で使用されるインデックスのリストを返したいことを除いて、同様の関数を作成したいと思います。R でいくつかのサンプル コードを見つけましたが、もっと一般化して機能化したいと考えています。これが私が最初に思いついたものです:
(最小は、モデルを適合させるために必要な観測の最小数です)
この関数は今のところうまく機能しますが、Rob Hyndman が議論している 2 つの関数を追加したいと思います。
- ウィンドウ処理: トレーニング セットを最初の観測に戻す代わりに、n 個の観測に戻します。
- 可変予測範囲: 各フォールドのトレーニング セットに 1 つのインデックスを追加する代わりに、各フォールドのトレーニング セットに k を追加します。
ウィンドウ処理を実装する方法は次のとおりです。
次のような可変予測範囲を実装する方法がわかりません: たとえば、k=3 の場合:
既存のコードを改善する方法と、フォールドごとにトレーニング セットに変数のインクリメントを追加する方法を探しています。
ありがとうございました
r - glmnetと2つのクラスを使用している場合、caretのtrain関数でエラーが発生しました
次のコードブロックは失敗しますが、理由はわかりません。
次のエラーが発生します。
正常に動作するなど、別のモデルにサブサブする場合glm
。3つのクラスを使用すると、、TrainClasses <- iris[,5]
も正常に機能します。
glmnetメソッドが失敗する原因となっている2つのクラスはどうですか?
これは、Windows上のRバージョン2.14.0、caretバージョン5.09-006です。同じエラーが私のMacとLinuxで発生します。
r - Rキャレットとgbmはntrees入力を見つけることができません
gbm
R でパッケージを使用してをトレーニングしようとしていcaret
ます。最初は次のエラーが発生し、入力がないためだと思ったので、 を作成しましたgbmGrid
が、同じエラー メッセージが表示されます。
助言がありますか?
r - factor()およびNAのRカレット/rfe変数選択
NAs
全体に惜しみなく散りばめられ たデータセットがあります。
さらに、である必要がある列がありますfactors()
。
パッケージ のrfe()
関数を使用して変数を選択しています。caret
NAを使用するデータには機能するが、因子変数には機能しないというfunctions=
議論があるようですが、因子変数には機能しますが、NAには機能しません。 rfe()
lmFuncs
rfFuncs
これに対処するための提案はありますか?
試してみmodel.matrix()
ましたが、問題が増えるようです。
r - caret::train: モデル生成パラメータを指定
caret
モデル生成には Rのライブラリを使用しています。earth
(別名 MARS) モデルを生成したいのですがdegree
、このモデル生成のパラメーターを指定したいと考えています。ドキュメント(11 ページ)によると、earth
このメソッドはこのパラメーターをサポートしています。
パラメータを指定すると、次のエラー メッセージが表示されます。
degree
パラメータを指定するときにこのエラーを回避するにはどうすればよいですか?
r - Rプログラミング、カレットによるランダムフォレスト
私はRの初心者であり、caretパッケージを使用してランダムフォレストアルゴリズムを実装したいと考えています。
ステップバイステップで役立つチュートリアルはありますか?
r - カレットでの並列処理はR2.13.0では機能しません
Rパッケージcaretを使用していますが、並列処理が機能しません。train
関数からexampleを実行しようとすると、次のようになります。
次のエラーが発生します。
私はMacBookPro、2.3GHz IntelCorei5およびMacOSX10.6.8を搭載した2011年初頭のモデルを使用しています。
Rセッション情報:
Rバージョン2.13.0(2011-04-13)プラットフォーム:x86_64-apple-darwin9.8.0 / x86_64(64ビット)
添付の基本パッケージ:[1]統計グラフィックgrDevicesutils
データセットメソッドベースその他の添付パッケージ:[1] caret_5.13-20 cluster_1.14.2 reshape_0.8.4 plyr_1.7.1lattice_0.19-33 mlbench_2.1-0
doMC_1.2.3 multicore_0.1-7 [9] foreach_1.3.2 codetools_0.2-8 iterators_1.0.5名前空間を介してロードされます(接続されていません):[1]compiler_2.13.0 grid_2.13.0 rpart_3.1-51 tools_2.13.0
これを修正するために私にできることはありますか?
r - キャレット モデルからのフォールド外予測の収集
キャレット モデルからのフォールド外予測を使用して、元の予測子の一部を含む第 2 段階のモデルをトレーニングしたいと考えています。次のように、フォールド外の予測を収集できます。
これは素晴らしいことですが、順序が間違っています。
train
オブジェクトが各フォールドのトレーニングに使用されたインデックスのリストを返すことはわかっています。
out_of_fold
この情報を使用して、元のデータセットと同じ順序でオブジェクトに観測を配置するにはどうすればよいBostonHousing
ですか?