AdaBoost アルゴリズムを実装しようとしていますが、2 つの質問があります。
1) 反復ごとに、確率分布に従ってトレーニング データを再サンプリングする必要があります。再サンプリングされたデータ セットのサイズは、元のデータ セットのサイズと同じである必要があります。2) 確率分布に従ってトレーニング データ セットを再サンプリングすると、1 つのデータ ポイントに対して複数のコピーを取得できる可能性が高くなります。各反復で弱分類器をトレーニングしている間、これらの冗長コピーをすべて保持する必要があります。