問題タブ [automl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
92 参照

python - ミニバッチ モードの Python SMAC の妥当な runco​​unt_limit 値

ハイパーパラメータの最適化にSMAC v3を使用しようとしています。

ターゲット関数 ( tae_runner ) の計算量を一定にして最適化プロセスを制限し、「ミニバッチ」モードで実行し たいと考えています。止まったところ。

この計算予算の妥当なサイズを決定するにはどうすればよいでしょうか?
以下に懸念事項を説明します。

私のターゲット関数はかなり高価で、計算に 1 ~ 10 秒、またはそれ以上かかることがあります。したがって、ミニバッチを使用して、問題に固有の追加の手順を実行することにしました。

このコードはうまくいくようです。ドキュメントで見つけたものは次のとおりです。

wallclock_limit、runco ​​unt_limit、および tuner-timeout は、最適化に使用される最大ウォールクロック時間、アルゴリズム呼び出しの数、および CPU 時間をそれぞれ制御するために使用されます。

リポジトリのコードから理解できる限り、このコードは次のように簡単に機能します。

1) SMAC は SMBO をラップし、シナリオとその他のパラメーターをそれに渡します。

2)常に新しいチャレンジャーを生成しているメインの SMBO ループがあります(インターリーブ ランダムを含めて、たまたま 10K になります)。

そしてそれらを現職者と比較します (これまでで最もよく見つかった構成):

runco ​​unt_limitしか設定していない場合、 time_boundは何ですか?

3) 予算を超えた場合、メインの smbo ループは終了します。

そして、生成され、コストが予測され、ソートされた残りのチャレンジャーは、単にドロップされます。

私の懸念は次のとおりです。runco​​unt_limit の値が小さすぎる場合、たとえば1、または10そのようなものである場合、多くの構成 (5K) を生成、ソート、および破棄するためのリソースが大量に浪費され、開始と停止のオーバーヘッドが発生する可能性があります。ミニバッチごとに smac 。
一方、runco​​unt_limitを 10K の倍数に設定すると、ミニバッチではなくなります。

それらのバッチのサイズを実証する方法を提案できますか?

0 投票する
1 に答える
74 参照

h2o - h2o.automl の sort_metric 引数が使用されない

次の方法で、マルチクラスの問題に対して h2o automl モデルを実行しようとしています

しかし、私はエラーが発生します

h2o.automl(y = 結果、training_frame = train_to_model、max_runtime_secs = 30、: 未使用の引数 (sort_metric = "logloss") のエラー

http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/sort_metric.htmlのドキュメントに基づいて、マルチクラス分類問題で対数損失を使用できるはずですが、できません。

私の h2o バージョンは 3.18.0.11 で、R バージョンは 3.4.1 です。

なぜこれが起こっているのか教えてください。ありがとうございました!