問題タブ [mlr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
230 参照

r - mlr で CV (リサンプリング) に定義済みの列を使用できますか?

mlrR パッケージで交差検証 (リサンプリング) を行うには、通常、makeResampleDesc関数を呼び出してメソッドとフォールドを指定する必要があります。

私の質問は次のとおりです。

  1. 事前に定義された列をフォールド列として使用することはできますか? または、
  2. makeResampleDescinは、mlr作成された襞が (同じ原因の種の下にある異なる学習者間で) 一貫性があり、さらに操作するためにエクスポートできることを確認しますか?
0 投票する
2 に答える
1521 参照

r - R MLR パッケージ: makeClassifTask がテスト セットの空の因子レベルをドロップしないようにする

Var1カテゴリ予測変数&を含むバイナリ分類の問題がありますVar2

トレーニング セットには の-2,-1,0レベルとしてすべてが含まれますが、テスト セットにはの入力としてVar1含まれません。-1Var1

Var1テスト セットのすべてのレベルが含まれていることを確認しました。

-1したがって、テスト データがそのレコードに含まれていなくても、空白因子レベルは存在します。

しかし、次を使用してテスト セットのタスクを作成しようとすると:

列の空の因子レベルが削除されたことを示す警告が表示されます。Var1

fixup.data = "no"パラメータも設定してみました。次のエラーが発生します。

PS: テスト データを自分でリサンプリングしているのではありません。これは、応答変数がわからない外部データ セットです。

また、タスクを作成する前に、テスト セットの応答変数のダミー値を再コーディングしました。

0 投票する
0 に答える
799 参照

r - R パッケージ mlr マルチラベル テキスト分類: 新しいデータを分類する方法

このコードは、パッケージを使用したマルチラベル分類に関するチュートリアルで見つけましたmlr

データセットの構造はyeast理解していますが、ラベルに TRUE または FALSE の値がないため、分類したい新しいデータがある場合にコードを使用する方法がわかりません。実際には、同じ構造のトレーニング データがいくつかありますyeastが、新しいデータの場合、列 1:14 が欠落します。私は何か誤解していますか?そうでない場合: コードを正しく使用するにはどうすればよいですか?

編集:

コードの使用方法のサンプルコードは次のとおりです。

問題は、test.data実際に計算したいラベルがないことです。

編集2:

単純に使うと

結果は両方のテキストで同じであり、実際には私が期待するものではありません.

0 投票する
0 に答える
2334 参照

r - R - mlr: ネストされたリサンプリング (空間) で調整されたサポート ベクター マシン モデルの変数の重要性を取得する簡単な方法はありますか?

の-packageを使用して、調整されたサポート ベクター マシン (svm)モデルのすべての予測子 (または変数、または機能) の変数の重要度を取得しようとしています。しかし、評価を正しく行っているかどうかはわかりません。さて、最初のアイデア:e1071::svmmlrR

正直に調整された svm-model を取得するために、外側のループで空間 n 分割交差検証 ( ) を使用し、内側のループで空間交差検証 ( ) を使用して、ネストされたリサンプリングのチュートリアルに従っています。チューニング パラメータとして、ランダム グリッド検索でチューニングされます。すべての予測子の変数の重要度評価として、 を使用したいと思います。これは、説明に関連して、基本的に、機能が順列された予測と順列されていない予測の間の合計された差です。SpRepCVSpCVgammacostpermutation.importance

には、変数の重要度を取得するためのフィルター関数mlrがいくつかありますが、同時に、ユーザー固有の選択入力 (しきい値または変数の数) に基づいてモデルを適合させる前にサブセットが作成されます。- ただし、すべての適合モデルのすべての変数の変数重要度を取得したいと考えています。(私はその学習者が「包括的な」重要な評価を持っていることを知っています)random forest

現在、リサンプリングの - 引数で使用mlr::generateFeatureImportanceDataしていますが、これは非常に厄介です。extractもっと簡単な方法がないのでしょうか?

mlr-development バージョンを使用した例: