問題タブ [grid-search]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
738 参照

python - ランダム化されたデータではなく、特定のデータセットでの scikit グリッド検索

私はpythonandscikit-learnを使用して、クロス検証テストを行っています。現在、パンダのデータフレームをトレーニング セット ( X_trainy_train) とテスト セット ( X_testy_test) に分割し、トレーニング セットに対してランダムな 3 分割クロス検証を実行し、グリッド検索の最終パラメーターを使用して最終モデルをプロジェクトに投影しています。テストセット:

したがって、これらのタイプのランダム化された k 分割グリッド検索を実行できるのはクールですがsklearn、特定のデータ セットでグリッド検索を行うネイティブな方法がライブラリ内にあります。上記の私のコードをより正確に言うと、グリッド検索から得られた最良のパラメーターが、結果のモデルが特定のデータセットに適合することによって決定され、ランダム化されていない場合に、指定されたパラメーターを使用して、モデルsklearnを開発するためのネイティブな方法がありますか?の k 倍、?X_trainy_trainX_trainy_train

0 投票する
2 に答える
7225 参照

machine-learning - sklearn でのグリッド検索の高速化

最適な SVM パラメーターを特定するためにグリッド検索を実行しています。ipython と sklearn を使用しています。コードは遅く、1 つのコアのみで実行されます。これをどのようにシードアップし、複数のコアを利用できますか? ありがとう

0 投票する
0 に答える
430 参照

python - GridSearchCV TypeError

Python の初心者です。ツイートをトークン化してステムを作成してモデルを作成し、gridsearch を使用して最適なハイパーパラメータを見つけようとしています。あらゆる種類のフィードバックをお待ちしています。

これは私のコードです:

これは、アップグレードしようとしているデータのサンプルです

そして、これはエラーです:


お時間をいただきありがとうございます。ところで、私は Windows 10 で作業しており、すべてのツールを更新しました

0 投票する
0 に答える
1041 参照

python - 最良の推定器だけでなく、Sklearn grid_search からすべての推定器を取得する方法は?

grid_params を使用して、トレーニング データに対してグリッド検索を実行します。最後に、テスト データに対していくつかの最良の推定量の predict_proba を実行したいのですが、grid_search からしか best_estimator を取得できません [ grid_search_best_estimator_.predict_proba(X) ]

私の質問は、「scikit-learn grid_search の別のデータで最初の n 推定量の predict_proba を実行するにはどうすればよいですか?

0 投票する
1 に答える
642 参照

python - GridSearchCV: 重みをスコアラーに渡す

GridSearchCV を使用して、XGB_Classifier の最適なパラメーター セットを見つけようとしています。私のデータは非常に不均衡であるため、重みを使用してフィッティングとスコアリング (cross_validation で) を実行する必要があるため、「重み」ベクトルをパラメーターとして受け取るカスタム スコアラーを使用する必要があります。ただし、GridSearchCV に「重み」ベクトルをスコアラーに渡す方法が見つかりません。

この機能を gridsearch に追加する試みがいくつかありました。

https://github.com/ndawe/scikit-learn/commit/3da7fb708e67dd27d7ef26b40d29447b7dc565d7

しかし、それらは master にマージされませんでした。現在、このコードはアップストリームの変更と互換性がないのではないかと心配しています。

誰かが同様の問題に直面したことがありますか?それに対処する「簡単な」方法はありますか?

0 投票する
1 に答える
3369 参照

python - パイプラインのグリッドサーチ

GridSearchCVScikitを使用して、パイプラインのパラメーターを検索しています。私は自分のコードを機能させましたが、追加したい場合class_weightsは壁にぶつかっています。

このパラメータを GridSearch に追加する適切な方法は何ですか?

0 投票する
0 に答える
1003 参照

python - 複数のスコアリング機能を備えた GridSeachCV?

GridSearchCV に渡すスコアリング関数によっては、 grid.best_estomator_ の結果が異なる場合があります。sklearn で単一の GridSearch を実行し、出力で複数のスコア (またはスコアリング関数の真の値) を取得できるかどうか疑問に思っていますか? 何かのようなもの:

そして、出力として次を取得します。

アイデアは、モデルのハイパーパラメーターのすべての組み合わせで、すべての評価指標のスコアを取得することです。GridSearchCV に 10 個の異なるスコアリング関数があるとします。GridSearchCV を 10 回実行して、すべてのスコアリング関数に最適なモデル パラメーターを確認するには、非常に時間がかかります。アイデアは、一度だけ実行して、grid_scores_ 内のすべてのスコアリング関数の数値 (スコア) を取得することです。

2015 年に sklearn にほぼ実装されたようですが、残念ながらプロジェクトは終了しませんでした: https://github.com/scikit-learn/scikit-learn/pull/2759 私は自分でこれを行う方法を探しています自分の。

0 投票する
1 に答える
1682 参照

scikit-learn - グリッドが 1 点だけであっても、skflow/TF Learn を使用した Gridsearchcv は永遠に実行されます

DNN 回帰のステップ、learning_rate、および batch_size でグリッドサーチを実行しようとしています。私は簡単な例でこれをやろうとしましたが、ここにボストンの例が示されているボストンのデータセットですが、うまくいきません。エラーはスローされず、実行され、実行され、実行されます。単一点のグリッドを設定しても、これは行われます。以下にエラーが表示されますか?明らかな何かを見逃していますか?私は sklearn と skflow の両方を初めて使用します (skflow は Tensorflow Learn にマージされていることは知っていますが、例は同じである必要があると思います) が、見つけた例を組み合わせただけです。

助けてくれてありがとう!!

0 投票する
2 に答える
1580 参照

python - 特定の検証データを使用したグリッド検索

K 分割検証を使用せずに、sklearn でハイパーパラメーターをグリッド検索する方法を探しています。つまり、グリッドを特定のデータセット (以下の例では X1、y1) でトレーニングし、特定のホールドアウト データセット (以下の例では X2、y2) で検証する必要があります。

X1,y2 = トレーニング データ
X2,y2 = 検証データ

0 投票する
1 に答える
2045 参照

machine-learning - Scikit Learn の Keras ラッパー - AUC スコアラーが機能しない

パラメータのランダム検索を容易にするために、Keras Scikit Learn Wrapperを使用しようとしています。ここにサンプルコードを書きました:

  1. 人工的なデータセットを生成します:

moonsから使っていますscikit learn

  1. モデル ビルダーの定義:

build_fn必要な機能を定義します:

  1. パラメータ グリッドの定義:

次に、パラメーター グリッドを定義しました。

  1. RandomizedSearchCV フェーズ:

私はRandomizedSearchCVオブジェクトを定義し、人工的なデータセットからの値を当てはめました:

私が得たもの(コンソールでこのコードを実行した後)は次のとおりです。

scoring = "roc_auc"I used accuracymetricを使用する代わりに、このコードは正常に機能します。誰が私に何が悪いのか説明できますか? 誰かが同様の問題を抱えていましたか?