問題タブ [regularized]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - h2o glm 正則化パス値
[Python 3.5.2、h2o 3.22.1.1、JRE 1.8.0_201]
glm lambda_searchラムダを選択するために正則化パスを使用して実行しています。
の値は次のregpath_pdとおりです。
ラムダのペナルティが減少すると、ncoef と auc が増加する (減少しない) と予想していました。これは、1 つの例外を除いて、ほとんどの場合に当てはまります。インデックス 23を参照してください- auc はかなり増加し、その後再び減少します。それについての説明はありますか?公差パラメータを設定する必要がありますか、それとも...? この実行ではnlambdas = 100(デフォルト)。50 に設定すると、ラムダ、ncoef、および auc の値が単調になります。
参考までに、この投稿の目的のために、ラムダと auc の値を小数点以下 3 桁に切り捨てました。これらの値は、実際の実行では切り捨てられません。
アップデート
ここのコードに従って、モデルがラムダごとに再トレーニングされるようにループを書き直しました。これは正しく機能し、単調性が維持されます。明らかに、実行にははるかに時間がかかります。私がたどり着いたアプローチは次のとおりです。問題のあるインデックスを特定し、そのインデックスのみの完全なモデルをトレーニングします。FWIWここにコードのその部分があります
結果のグラフを以下に示します (縮尺は異なります)。に問題があるようgetGLMRegularizationPathです。
r - LASSOでLDAを実行しようとしています
PenalizedLDA( x = train_x, y =train_y)戻り値
sort.int(x、na.last = na.last、減少 = 減少、...) のエラー: 'x' はアトミックでなければなりません
UCIの sampbase データセットに対してなげなわで線形判別分析を使用しようとしています (列にヘッダーを追加し、必要に応じて列を間隔 [0,1] に戻します。
初めてコードを実行したときにエラーが発生しました
PenalizedLDA(x = train_x, y = train_y) のエラー: y は数値ベクトルである必要があり、値は次のとおりです: 1、2、....
train_y を次のように渡すことで解決しました
もう一度実行すると、エラーが発生しました
sort.int(x、na.last = na.last、減少 = 減少、...) のエラー: 'x' はアトミックでなければなりません
ここで行き詰まりました。

