問題タブ [mlr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - mlr で CV (リサンプリング) に定義済みの列を使用できますか?
mlr
R パッケージで交差検証 (リサンプリング) を行うには、通常、makeResampleDesc
関数を呼び出してメソッドとフォールドを指定する必要があります。
私の質問は次のとおりです。
- 事前に定義された列をフォールド列として使用することはできますか? または、
makeResampleDesc
inは、mlr
作成された襞が (同じ原因の種の下にある異なる学習者間で) 一貫性があり、さらに操作するためにエクスポートできることを確認しますか?
r - R MLR パッケージ: makeClassifTask がテスト セットの空の因子レベルをドロップしないようにする
Var1
カテゴリ予測変数&を含むバイナリ分類の問題がありますVar2
。
トレーニング セットには の-2,-1,0
レベルとしてすべてが含まれますが、テスト セットにはの入力としてVar1
含まれません。-1
Var1
Var1
テスト セットのすべてのレベルが含まれていることを確認しました。
-1
したがって、テスト データがそのレコードに含まれていなくても、空白因子レベルは存在します。
しかし、次を使用してテスト セットのタスクを作成しようとすると:
列の空の因子レベルが削除されたことを示す警告が表示されます。Var1
fixup.data = "no"
パラメータも設定してみました。次のエラーが発生します。
PS: テスト データを自分でリサンプリングしているのではありません。これは、応答変数がわからない外部データ セットです。
また、タスクを作成する前に、テスト セットの応答変数のダミー値を再コーディングしました。
r - R パッケージ mlr マルチラベル テキスト分類: 新しいデータを分類する方法
このコードは、パッケージを使用したマルチラベル分類に関するチュートリアルで見つけましたmlr
。
データセットの構造はyeast
理解していますが、ラベルに TRUE または FALSE の値がないため、分類したい新しいデータがある場合にコードを使用する方法がわかりません。実際には、同じ構造のトレーニング データがいくつかありますyeast
が、新しいデータの場合、列 1:14 が欠落します。私は何か誤解していますか?そうでない場合: コードを正しく使用するにはどうすればよいですか?
編集:
コードの使用方法のサンプルコードは次のとおりです。
問題は、test.data
実際に計算したいラベルがないことです。
編集2:
単純に使うと
結果は両方のテキストで同じであり、実際には私が期待するものではありません.
r - R - mlr: ネストされたリサンプリング (空間) で調整されたサポート ベクター マシン モデルの変数の重要性を取得する簡単な方法はありますか?
の-packageを使用して、調整されたサポート ベクター マシン (svm)モデルのすべての予測子 (または変数、または機能) の変数の重要度を取得しようとしています。しかし、評価を正しく行っているかどうかはわかりません。さて、最初のアイデア:e1071::svm
mlr
R
正直に調整された svm-model を取得するために、外側のループで空間 n 分割交差検証 ( ) を使用し、内側のループで空間交差検証 ( ) を使用して、ネストされたリサンプリングのチュートリアルに従っています。チューニング パラメータとして、ランダム グリッド検索でチューニングされます。すべての予測子の変数の重要度評価として、 を使用したいと思います。これは、説明に関連して、基本的に、機能が順列された予測と順列されていない予測の間の合計された差です。SpRepCV
SpCV
gamma
cost
permutation.importance
には、変数の重要度を取得するためのフィルター関数mlr
がいくつかありますが、同時に、ユーザー固有の選択入力 (しきい値または変数の数) に基づいてモデルを適合させる前にサブセットが作成されます。- ただし、すべての適合モデルのすべての変数の変数重要度を取得したいと考えています。(私はその学習者が「包括的な」重要な評価を持っていることを知っています)random forest
現在、リサンプリングの - 引数で使用mlr::generateFeatureImportanceData
していますが、これは非常に厄介です。extract
もっと簡単な方法がないのでしょうか?
mlr
-development バージョンを使用した例: