マイクの答えは正しいです。グリッド検索パラメーターのサブサンプリングは、おそらくSVR
中規模のデータセット サイズでトレーニングするための最良の戦略です。SVR はスケーラブルではないため、完全なデータセットでグリッド検索を行って時間を無駄にしないでください。1000 のランダムなサブサンプルを試し、次に 2000、次に 4000 を試します。毎回 C とガンマの最適値を見つけ、データセットのサイズを 2 倍にするたびにそれらがどのように変化するかを推測してみてください。
また、 Nystroem カーネル近似と SGDRegressor、LinearRegression、LassoCV、ElasticNetCV などの線形リグレッサー モデルを使用して、真の SVR ソリューションを近似することもできます。RidgeCV は、領域内の LinearRegression を改善しない可能性がありn_samples >> n_features
ます。
最後に、 a のモデルの前にaMinMaxScaler
または aを配置して、入力データをスケーリングすることを忘れないでください。StandardScaler
SVR
Pipeline
モデルも試してみGradientBoostingRegressor
ます (ただし、SVR とはまったく関係ありません)。