問題タブ [r-caret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
784 参照

r - キャレットの「train」関数に新しいメソッドを追加する

RSNSS (Stuttgart Neural Network Simulator) でキャレットを使用してモデルをトレーニングしたいと考えています。残念ながら、RSNSS はまだトレインに実装されていないようです。新しいメソッドを追加するための train 関数のドキュメントはないようです。他の誰かがこれを自分で試したのではないかと思っていました。

rsnss オブジェクトには 'train' と 'predict' の両方のメソッドが既に定義されているので、これはそれほど難しくないと思います。

ありがとうございました。

/edit: Caret に RSNSS パッケージのメソッドが含まれるようになりました。

0 投票する
3 に答える
9355 参照

r - キャレットトレインが大量のメモリを消費するのはなぜですか?

を使用してトレーニングするとglm、すべてが機能し、メモリを使い果たすことさえありません。しかし、train(..., method='glm')実行するとメモリが不足します。

これtrainは、クロス検証の反復ごとに大量のデータを保存しているためですか (または trControl プロシージャが何であれ)? 私は見てtrainControlいますが、これを防ぐ方法が見つかりません...ヒントはありますか?私が気にするのは、パフォーマンスの概要と、おそらく予測された応答だけです。

(glmのグリッドがないため、パラメーター調整グリッド検索の各反復からのデータの保存に関連していないことはわかっています。)

0 投票する
1 に答える
801 参照

r - 時系列クロス検証を使用して createFolds を模倣する

R パッケージの caret は、相互検証で使用されるトレーニング セットのインデックスのリストを返す便利な関数createFoldsを提供します。

時系列の相互検証で使用されるインデックスのリストを返したいことを除いて、同様の関数を作成したいと思います。R でいくつかのサンプル コードを見つけましたが、もっと一般化して機能化したいと考えています。これが私が最初に思いついたものです:

(最小は、モデルを適合させるために必要な観測の最小数です)

この関数は今のところうまく機能しますが、Rob Hyndman が議論している 2 つの関数を追加したいと思います。

  1. ウィンドウ処理: トレーニング セットを最初の観測に戻す代わりに、n 個の観測に戻します。
  2. 可変予測範囲: 各フォールドのトレーニング セットに 1 つのインデックスを追加する代わりに、各フォールドのトレーニング セットに k を追加します。

ウィンドウ処理を実装する方法は次のとおりです。

次のような可変予測範囲を実装する方法がわかりません: たとえば、k=3 の場合:

既存のコードを改善する方法と、フォールドごとにトレーニング セットに変数のインクリメントを追加する方法を探しています。

ありがとうございました

0 投票する
1 に答える
2118 参照

r - glmnetと2つのクラスを使用している場合、caretのtrain関数でエラーが発生しました

次のコードブロックは失敗しますが、理由はわかりません。

次のエラーが発生します。

正常に動作するなど、別のモデルにサブサブする場合glm。3つのクラスを使用すると、、TrainClasses <- iris[,5]も正常に機能します。

glmnetメソッドが失敗する原因となっている2つのクラスはどうですか?

これは、Windows上のRバージョン2.14.0、caretバージョン5.09-006です。同じエラーが私のMacとLinuxで発生します。

0 投票する
3 に答える
5278 参照

r - Rキャレットとgbmはntrees入力を見つけることができません

gbmR でパッケージを使用してをトレーニングしようとしていcaretます。最初は次のエラーが発生し、入力がないためだと思ったので、 を作成しましたgbmGridが、同じエラー メッセージが表示されます。

助言がありますか?

0 投票する
1 に答える
1424 参照

r - factor()およびNAのRカレット/rfe変数選択

NAs全体に惜しみなく散りばめられ たデータセットがあります。

さらに、である必要がある列がありますfactors()

パッケージ のrfe()関数を使用して変数を選択しています。caret

NAを使用するデータには機能するが、因子変数には機能しないというfunctions=議論があるようですが、因子変数には機能しますが、NAには機能しません。 rfe()lmFuncsrfFuncs

これに対処するための提案はありますか?

試してみmodel.matrix()ましたが、問題が増えるようです。

0 投票する
2 に答える
8465 参照

r - caret::train: モデル生成パラメータを指定

caretモデル生成には Rのライブラリを使用しています。earth(別名 MARS) モデルを生成したいのですがdegree、このモデル生成のパラメーターを指定したいと考えています。ドキュメント(11 ページ)によると、earthこのメソッドはこのパラメーターをサポートしています。

パラメータを指定すると、次のエラー メッセージが表示されます。

degreeパラメータを指定するときにこのエラーを回避するにはどうすればよいですか?

0 投票する
3 に答える
6303 参照

r - Rプログラミング、カレットによるランダムフォレスト

私はRの初心者であり、caretパッケージを使用してランダムフォレストアルゴリズムを実装したいと考えています。

ステップバイステップで役立つチュートリアルはありますか?

0 投票する
2 に答える
1692 参照

r - カレットでの並列処理はR2.13.0では機能しません

Rパッケージcaretを使用していますが、並列処理が機能しません。train関数からexampleを実行しようとすると、次のようになります。

次のエラーが発生します。

私はMacBookPro、2.3GHz IntelCorei5およびMacOSX10.6.8を搭載した2011年初頭のモデルを使用しています。

Rセッション情報:

Rバージョン2.13.0(2011-04-13)プラットフォーム:x86_64-apple-darwin9.8.0 / x86_64(64ビット)

添付の基本パッケージ:[1]統計グラフィックgrDevicesutils
データセットメソッドベース

その他の添付パッケージ:[1] caret_5.13-20 cluster_1.14.2 reshape_0.8.4 plyr_1.7.1lattice_0.19-33 mlbench_2.1-0
doMC_1.2.3 multicore_0.1-7 [9] foreach_1.3.2 codetools_0.2-8 iterators_1.0.5

名前空間を介してロードされます(接続されていません):[1]compiler_2.13.0 grid_2.13.0 rpart_3.1-51 tools_2.13.0

これを修正するために私にできることはありますか?

0 投票する
1 に答える
2692 参照

r - キャレット モデルからのフォールド外予測の収集

キャレット モデルからのフォールド外予測を使用して、元の予測子の一部を含む第 2 段階のモデルをトレーニングしたいと考えています。次のように、フォールド外の予測を収集できます。

これは素晴らしいことですが、順序が間違っています。

trainオブジェクトが各フォールドのトレーニングに使用されたインデックスのリストを返すことはわかっています。

out_of_foldこの情報を使用して、元のデータセットと同じ順序でオブジェクトに観測を配置するにはどうすればよいBostonHousingですか?