2

完了前に grid_search.fit() を中断すると、これまでに行ったすべてが失われますか? グリッド検索に少し夢中になり、わいせつなほど大きな検索スペースを提供しました。私はすでに満足しているスコアを見ることができますが、私の stdout はそれらのスコアにつながったパラメータを表示しません..

ドキュメントを検索しました: http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html

そして、ここに並列検索の機能を追加することについて、数年前からの議論があります: https://sourceforge.net/p/scikit-learn/mailman/message/31036457/

しかし、決定的なものはありません。私の検索は最大 48 時間機能しているので、発見されたものを失いたくないのですが、続行したくありません。

ありがとう!

4

1 に答える 1

3

SOへようこそ!

私の理解では、 grid_search 関数から返される中間変数はなく、結果のグリッドとそのスコアのみが返されます (詳細については、ここを参照grid search.py​​ )。

そのため、キャンセルすると、これまでに行った作業が失われる可能性があります。

しかし、ちょっとしたアドバイスとして、48 時間は長い時間です (明らかに、これは、調整されている行、列、およびハイパーパラメーターの数によって異なります)。最初に、より広範なグリッド検索から始めて、それからパラメーター検索を絞り込むことができます。

これにより、次の 2 つのメリットがあります。

  1. 実行時間が大幅に短縮される可能性があります (上記の警告を参照)。つまり、それほど長く待つ必要がなく、結果を失うリスクがありません。

  2. モデル予測スコアが 1 つまたは 2 つのハイパー パラメーターの影響を受けるだけであることがわかる場合があります。これにより、他の検索をより幅広く維持し、予測精度に最も影響を与えるパラメーターに労力を集中させることができます。

願わくば、私がこの回答を書いている頃には、あなたのグリッド検索は完了しています!!

于 2016-09-07T21:59:46.013 に答える