問題タブ [mlr3]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 並列化を使用して mlr3 でリサンプリングを行うときに再現可能な結果を得る方法
最近、並列化で mlr3 パッケージを使用することについて学習していました。mlr3 本 ( https://mlr3book.mlr-org.com/technical.html ) とチュートリアル ( https://www.youtube.com/watch?v=T43hO2o_nZw&t=1s ) からの紹介として、mlr3 は将来のバックエンドを使用します。並列化のため。次のコードで簡単なテストを実行します。
AUC は毎回変化しますが、並列化のランダム シードを設定していないため、それはわかっています。しかし、将来のパッケージに関する多くのチュートリアルを見つけました。将来で再現可能な結果を得る方法は、 future.apply パッケージのfuture_lapplyを使用し、 future.seed = TRUEを設定することです。もう 1 つの方法は、%dorng% または registerDoRNG() を使用して foreach ループの将来のバックエンドを設定するようなものです。
私の質問は、future_lapply または foreach を使用せずに mlr3 で再現可能なリサンプリング結果を取得するにはどうすればよいですか? それを得る簡単な方法があるかもしれないと思います。どうもありがとう!
r - 重要度に基づく変数削減
モデルで最も重要でない変数を除外するのに苦労しています。4,000 を超える変数を含む一連のデータを受け取りましたが、モデルに入れる変数の数を減らすように依頼されました。
私はすでに2つのアプローチを試みましたが、2回失敗しました。
私が最初に試みたのは、モデリング後に変数の重要性を手動でチェックし、それに基づいて重要でない変数を削除することでした。
simple を使用している間、すべてが正常に機能しますLearner
。
問題は、データが非常に不均衡であるGraphLearner
ことPipeOp
ですAutoTuner
.
この場合、検索スペース、ターミネーター、チューナーなど、重要ではないと思われるコードの一部をスキップしました。
at
正しく知られている問題は、重要なプロパティが利用できない内でまだ表示されているにもかかわらず$importance()
です。
そこで、アプローチを変更して、フィルタリングを に追加することにしましたLearner
。そして、それは私がさらに失敗したところです。この mlr3book ブログ ( https://mlr3book.mlr-org.com/fs.html ) を調べることから始めました。ブログと同じように Learnerに追加しようとしimportance = "impurity"
ましたが、id でエラーが発生しました。
これは基本的に次のようなことを意味します。
フィルタリングで回避策も試みましたPipeOp
が、惨めに失敗しました。なしではできないと思いますimportance = "impurity"
。
私の質問は、私が目指していることを達成する方法はありますか?
さらに、モデリングの前に重要度によるフィルタリングが可能である理由を説明していただければ幸いです。モデルの結果に基づくべきではありませんか?
mlr3 - dalex パッケージについて少し混乱
こんにちは、mlr3 チームです。
mlr3 本で提供されている dalex パッケージについて質問があります。具体的にはこちら
前もって感謝します