問題タブ [r-caret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R、キャレット: トレーニング セットとホールドアウト (検証) セットを指定するにはどうすればよいですか?
データセットがあり、データセットの特定の部分のみでキャレットをトレーニングして検証したいと考えています。私は2つのリストを持っています
と
これは、データ セットの行インデックスに対応します。train.ids$T1
テストには使用する必要がありますが、トレーニングには使用するtest.ids$T1
必要があります。T2 と T3 についても同様です。
使ってみた
しかし、これは trainControl を使用する正しい方法ではないようです。
どんな助けでも大歓迎です
r - R キャレット トレイン evalSummaryFunction のエラー: 回帰のクラス確率を計算できません
cv.ctrl では classProbs が TRUE に設定されているため、このエラー メッセージが表示される理由がわかりません。
誰かがアドバイスできますか?
r - R キャレット 感度のエラー。デフォルト
以下は、データ構造の抜粋です。
感度設定は必要ですか?または、何が欠けていますか?
r - nnet ニューラル ネットワークに varImp を使用するとエラーが発生する
varImp
キャレットを介してnnetメソッドで作成されたニューラルネットワークモデルで関数を使用する必要があります。
コード:
使用しようとするとvarImp
、次のエラーが発生します。
異なる数のニューロンでいくつかのテストを行いました。ニューロンの数 (サイズ パラメータ) が 9 より大きい場合にエラーが発生するようです。修正方法を教えてください。
r - キャレット パッケージを使用しているが、ライブラリでエラーが発生する(e1071)
これが私のコードで、かなり標準的ですが、エラーメッセージが表示されます:
エラー メッセージ:
何か案が?ありがとう!
r - predict() 関数の奇妙な動作
私は現在、Coursera から「実践的な機械学習」コースを受講しており、予測機能で奇妙な動作に遭遇しています。尋ねられた質問は、ツリーをトレーニングしてからいくつかの予測を行うことでした。ここに回答を投稿しないように、問題に使用されるデータセットを変更しました。コードは次のとおりです。
上記のコードには、2 つの主要なセクションがあります。1 つ目はツリーを構築し、2 つ目 (ここsampleData
から開始) は、モデルを適用するデータの小さなサンプル セットを作成します。元のデータとまったく同じ構造であることを確認するには、トレーニング データセットの最初の行をコピーし、すべての列を に設定しますNA
。次に、デシジョン ツリーに必要な列 (この場合はwt
変数) だけにデータを入れます。
上記のコードを実行すると、次の結果が得られます。
参考までに、ツリーの構造は次のとおりです。
predict
関数が私が提供したの予測値を返さない理由を誰かが理解するのを手伝ってくれますsampleData
か?
r - キャレットパッケージでモデルを構築する際に進捗を追跡する方法は?
キャレット パッケージの train 関数を使用してモデルを構築しようとしています:
トレーニング セットには約 20K の観測が含まれ、各観測には 100 を超える変数があります。そのデータセットからモデルを構築するのに数時間または数日かかるかどうかを知りたいです。
データからモデルをトレーニングするのに必要な時間を見積もる方法は? キャレット パッケージの関数を使用するときに、トレーニング プロセスの進行状況を追跡するにはどうすればよいですか?
r - RのconfusionMatrixから全体的な精度値を取得するには?
Rキャレットライブラリで、以下のような混同行列が得られた場合、全体の精度0.992を取得する方法はありますか? この値を保存して後の処理に使用する必要があるため、この単一の値を取得することはできません。これはまったく可能ですか?
全体統計
Mcnemar の検定の P 値 : NA
クラス別統計:
r - キャレットのhtml出力の桁数を制御する
私はコードを持っています
コンソールで素敵な出力を生成します
ただし、html 生成中はすべての数値が丸められます
コンソールと同じ出力をhtmlに保存するには?
詳細な調査と回避策
Rスタジオを使用しています。R セッションを開始した直後getOption("digits")
は 7 を返します。ただし、html 生成中の数値出力は丸められます。コンソール出力はOKです。
コード チャンクを設定options(digits = 7)
すると、html とコンソールの両方の出力が同じになり、正しくなります。
私はそのような振る舞いを理解できませんが、うまくいきます。それはバグですか、それとも機能ですか?
r - summaryFunction キャレット分類のカスタム メトリック (hmeasure)
キャレットで SVM をトレーニングするためのカスタム メトリックとしてhmeasure メトリックHand,2009を使用しようとしています。私はRの使用に比較的慣れていないので、twoClassSummary関数を適応させてみました。キャレットで ROC やその他の分類パフォーマンスの尺度を使用する代わりに、モデル (svm) から真のクラス ラベルと予測されたクラス確率をhmeasureパッケージの HMeasure 関数に渡すだけで済みます。
たとえば、R の HMeasure 関数 (HMeasure(true.class,predictedProbs[,2])) を呼び出すと、Hmeasure が計算されます。以下の twoClassSummary コードの適応を使用すると、エラーが返されます。「x」は数値でなければなりません。
おそらく、そのトレーニング関数は、HMeasure 関数を評価するために予測される確率を「見る」ことができません。どうすればこれを修正できますか?
私はドキュメントを読み、回帰を扱うSOに提起されたリンクされた質問を読みました。それは私にいくらかの方法をもたらしました。解決策への助けや指針に感謝します。
以下の非動作コード。