Weka の Simple Logistic Function が正則化を使用しているかどうか疑問に思っています。
ドキュメントにはそれについての言及はありませんが、よくわかりません。誰でもこれを確認できますか?
*線形ロジスティック回帰モデルを構築するための分類子。単純な回帰関数を基本学習器として持つ LogitBoost は、ロジスティック モデルの適合に使用されます。実行する LogitBoost 反復の最適な数は相互検証され、自動属性選択につながります。詳細については、次を参照してください。
Niels Landwehr、Mark Hall、Eibe Frank (2005)。ロジスティック モデル ツリー。Marc Sumner、Eibe Frank、Mark Hall: Logistic Model Tree Induction の高速化。: データベースにおける知識発見の原則と実践に関する第 9 回ヨーロッパ会議、675-683、2005 年。
オプション
debug -- true に設定すると、分類子は追加情報をコンソールに出力する場合があります。useCrossValidation -- LogitBoost 反復回数をクロス検証するか、トレーニング セットの停止基準を使用するかを設定します。設定されていない場合 (固定の反復回数が指定されていない場合)、トレーニング セットのエラー (誤分類エラーまたは errorOnProbabilities に応じた確率のエラー) を最小化する LogitBoost 反復回数が使用されます。
errorOnProbabilities -- LogitBoost 反復の最適な回数を決定する際に、確率のエラーをエラー測定として使用します。設定されている場合、二乗平均平方根誤差を最小化する LogitBoost 反復回数が選択されます (useCrossValidation に応じて、トレーニング セットまたはクロス検証で)。weightTrimBeta -- LogitBoost で重みのトリミングに使用されるベータ値を設定します。次の反復では、前の反復からの重量の (1 - ベータ)% を運ぶインスタンスのみが使用されます。ウェイト トリミングを行わない場合は 0 に設定します。デフォルト値は 0 です。 numBoostingIterations -- LogitBoost の固定反復回数を設定します。>= 0 の場合、実行する LogitBoost 反復回数を設定します。< 0 の場合、数値がクロス検証されるか、トレーニング セットの停止基準が使用されます (useCrossValidation の値に応じて)。
useAIC -- AIC は、LogitBoost 反復をいつ停止するかを決定するために使用されます (クロス検証またはトレーニング エラーの代わりに)。
heuristicStop -- heuristicStop > 0 の場合、LogitBoost 反復回数の相互検証中に貪欲に停止するためのヒューリスティックが有効になります。これは、最後の heuristicStop 反復で新しいエラーの最小値に達しなかった場合、LogitBoost が停止されることを意味します。このヒューリスティックを使用することをお勧めします。これにより、特に小さなデータセットで大幅な高速化が得られます。デフォルト値は 50 です。
maxBoostingIterations -- LogitBoost の反復の最大回数を設定します。デフォルト値は 500 です。非常に小さい/大きいデータセットの場合は、より低い/より高い値が望ましい場合があります。*