問題タブ [mlr3]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 最大距離を指定できる knn アルゴリズムの制約付きバージョンはありますか?
R で knn アルゴリズムを使用しています。
このアルゴリズムは、特徴空間で k 個の「最も近い」ポイントを選択し、これらの k 個の最も近いポイントに基づいて予測/確率を計算します。
私の問題/質問: 最大距離を指定できますか? いくつかのポイントでは、「k 最近傍点」があまりにも離れているため、それらを使用しても意味がない場合があります。したがって、すべての最も近い点が「遠すぎる」場合に「NA」を与えるアルゴリズムの拡張バージョンが必要です。また、このしきい値をハイパーパラメーターとして指定し、後で調整できるようにしたいと考えています。
そのような変種は存在しますか?そして、すでにRに実装されていますか?
r - mlr3 によるベンチマーク
mlr3 ベンチマークの動作を理解できません。私は 6 つのモデルを開発し、ネストされた CV を使用して、ハイパーパラメーターを調整しました (例: rpart 学習器の 2 つのハイパーパラメーター)。私のデスクトップでは、各モデルに約 10 分かかります。次に、6 つのモデルのベンチマークを使用しますが、2 時間経過してもベンチマーク プロセスはまだ終了していません。個々のモデルよりもベンチマークの方が時間がかかる理由を理解したいと思います。これは当然のことでしょうか、それとも私がどこかで間違っているのでしょうか。また、より効率的な方法で複数のモデル (5-10-20 モデル) を合理的に比較 (ベンチマーク) するための最良のオプションは何かを理解したいと思います。他の 6 つのモデルでは、完了するまでに 48 時間かかりました。また、並列化を試みてもパフォーマンスは向上しませんでした (おそらく、Windows で作業しているため、将来の R パッケージは理想的には機能しません)。どうもありがとう!