問題タブ [grid-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - GridSearchCV を使用したランダム フォレスト ハイパーパラメータ チューニング scikit-learn
問題にランダム フォレストを使用しようとしています (以下は、私のデータではなく、ボストン データセットのサンプル コードです)。ハイパーパラメータの調整に使用する予定GridSearchCV
ですが、さまざまなパラメータの値の範囲はどのようにする必要がありますか? 選択している範囲が正しいことをどのように確認できますか?
私はインターネットでそれについて読んでいて、誰かが2回目のグリッド検索で最適化を「ズームイン」することを提案しました(たとえば、10の場合は[5、20、50]を試してください)。
これは正しいアプローチですか?ランダム フォレストに必要なすべてのパラメーターに対してこのアプローチを使用しますか? このアプローチは、「良い」組み合わせを見逃す可能性がありますよね?
python - scikit 予測に GridSearchCV 出力を使用するには?
次のコードでは:
予測には何を使用する必要がありますか?
gs
?gs.best_estimator_
? またgs.best_estimator_.named_steps['clf']
?
これら3つの違いは何ですか?
machine-learning - Sklearn の VotingClassifier で RandomizedSearchCV をどのように実行しますか?
投票分類子を調整しようとしています。Sklearn でランダム化された検索を使用したかったのです。ただし、現在 2 つのアルゴリズム (異なるツリー アルゴリズム) を使用しているため、投票分類子のパラメーター リストをどのように設定できますか? ランダム化された検索を個別に実行し、後で投票分類子でそれらを組み合わせる必要がありますか?
誰か助けてくれませんか?コード例は高く評価されます:)
ありがとう!
machine-learning - Sklearn の VotingClassifier で RandomizedSearch に fit_params をどのように使用しますか?
こんにちは、データセットのバランスが取れていないため、Sklearn の VotingClassifier を使用した RandomizedSearch に fit_params (GradientBoostingClassifier の sample_weight 用) を使用しようとしています。誰かが私にアドバイスやコードサンプルを教えてもらえますか?
現在動作していないコードは次のとおりです。
エラー:
python - c およびガンマの sklearn.svm で GridSearchCV を使用すると値エラーが発生する
与えます:
予想通りですが、次のコードを実行すると:
私はこれを取得します: ValueError: Invalid parameter c for estimator SVC
私は手動でそれらを自分で実行したので、これらがcの有効な値であると確信しています。すべてを微調整しようとしています。
python - GridsearchCV を実行するより速い方法はありますか
sklearn で SVC のいくつかのパラメーターを最適化していますが、ここでの最大の問題は、他のパラメーター範囲を試す前に 30 分待たなければならないことです。さらに悪いことに、同じ範囲内で c とガンマの値を増やしたい (より滑らかなサーフェス プロットを作成できるようにするため) ことは事実ですが、時間がかかることはわかっています... 今日実行したときcache_size を 200 から 600 に変更して (それが何をするのかよくわからないまま)、違いがあるかどうかを確認しました。時間は約1分短縮されました。
これは私が助けることができるものですか?それとも、非常に長い間対処する必要がありますか?
戻り値:
python - R^n での立方体/球体のグリッド検索
R^n
がn
不明なの球体に対してグリッド検索を (問題がある場合は Python で) 実装しようとしています。
入力には、球の半径と中心、およびtheta
グリッドの解像度を制御するハイパーパラメータが含まれます。この球体の各点を、これら 3 つのパラメーターの関数として表現したいと思います。
また、立方体の面のみを反復して、立方体検索を検討することも考えています。(つまり、L_inf
球体の反復)
n=2 だとわかっていたら、次のようにします。
任意に大きくなる可能性があるためn
、球\キューブを効率的に反復処理する方法を探しています。
何か案は?
++++++++++++++++++++++++++++++++++++++++++++++++++++ +++++++++++
私は、ストラブリーが提案したものの修正版を使用することになりました:
出力図:
もう 1 つのオプションは 、球上に均一に分散されたサンプルを生成することです。サンプルの数がポイントの「密度」(または期待される密度) を制御することに注意してください。
(単純さと効率の点で) 最悪の方法は、n-1 角度の列挙を使用して球上に点を生成することです。効率の欠如は、計算された製品の必要性に起因しsin
、cos
多くの場合(これもハッキングされる可能性があります)