adaboost - エラー率がゼロの場合のアルファの計算方法 (Adaboost)

Question

アルファのアルゴリズムは (0.5) * Math.log(((1 - errorRate) / errorRate))

ありがとうございました。

score 6 · Accepted Answer

トレーニングデータ全体を再重み付けして弱学習器に渡すことでブーストしている場合、データを完璧に分類した後で、実際には強力な弱分類器を見つけたと思います。

この場合、最初の Adaboost 反復で発生するはずです。アルファを 1 に設定して弱分類器を強分類器に追加し、トレーニングを停止します。

リサンプリングによるブースティング中にそれが発生し、サンプルがトレーニングデータのサブセットにすぎない場合は、このサブセットを破棄して別のサンプルで再試行する必要があると思います。

非常に単純な例で遊んでいるか、トレーニングデータセットが非常に小さいか代表的でないため、このような結果に達したと思います。また、弱分類器が弱すぎて、ランダムな推測に近づきすぎている可能性もあります。

score 3 · Accepted Answer

通常、誤差ゼロの弱分類器のアルファは、すべてのトレーニングインスタンスを正しく分類するため、大きくする必要があります。アルファを推定するためにすべてのトレーニングデータを使用していると仮定しています。ブーストのそのラウンドのトレーニングサンプルのみを使用してアルファを推定している可能性もあります。この場合、アルファはサンプルサイズに基づいてわずかに小さくする必要がありますが、考え方は同じです。

理論的には、他のアルファが正規化されていない場合、このアルファは無限大に近いはずです。実際には、エラーがゼロかどうかを確認し、それらのアルファに非常に高い値を与えるという提案は合理的ですが、通常、エラー率がゼロまたはゼロに近い場合は、オーバーフィッティングを示しています (または、信頼できるアルファを推定するにはトレーニングデータが少なすぎます)。 .

これは、Adaboostの Schapire & Singer の Confidence Rated Predictionsバージョンのセクション 4.2 で説明されています。彼らは、安定性のために分子と分母に小さなイプシロンを追加することを提案しています。

alpha = (0.5) * Math.log(((1 - errorRate + epsilon) / (errorRate + epsilon)))

いずれにせよ、このアルファは小さい値に設定しないでください (大きくする必要があります)。また、それを 1 に設定することは、他のすべてのブーストラウンドの他のすべてのアルファが正規化されている場合にのみ意味があるため、すべてのアルファの合計がほぼ 1 になります。

score 1 · Accepted Answer

私はこの問題に数回遭遇しましたが、通常、エラーが 0 に等しいかどうかを確認し、0 である場合は、最小重みの 1/10 に等しく設定します。これはハックですが、通常はかなりうまく機能します。

adaboost - エラー率がゼロの場合のアルファの計算方法 (Adaboost)

4 に答える 4

Related

Reference