私はElements of Statistical Learning ESLIIを読んでいます.2章には、いくつかの学習アルゴリズムを説明するためのガウス混合データセットがあります。このデータセットを生成するために、最初に二変量ガウス分布 N((1,0)', I) から 10 個の平均を生成します。私は彼らが何を意味するのか分かりませんか?
平均 (1,0) を持つ二変量分布から 10 の平均を生成するにはどうすればよいですか?
私はElements of Statistical Learning ESLIIを読んでいます.2章には、いくつかの学習アルゴリズムを説明するためのガウス混合データセットがあります。このデータセットを生成するために、最初に二変量ガウス分布 N((1,0)', I) から 10 個の平均を生成します。私は彼らが何を意味するのか分かりませんか?
平均 (1,0) を持つ二変量分布から 10 の平均を生成するにはどうすればよいですか?
二変量ガウス分布から生成される各平均は、分布から生成される可能性のある他の任意の点とまったく同じ方法でサンプリングされた単一の点です。彼らがこれらの生成されたポイントを新しい配布の手段として使用しているという事実は関係ありません。
次に、10 個の平均のそれぞれを使用して、新しい二変量ガウスを構築するとします。
~ N( (1,0), I) を意味します
~は、分布から引き出された値を示します。この場合にサンプリングされる分布は二変量ガウス分布であるため、サンプリングされる各データ ポイントは 2 次元のポイント (x1, y1) になります。
元の分布からサンプリングされたこれらの各ポイントを使用して、新しい分布を作成できます。
例:
means = [ (x1,y1), (x2,y2), ..., (x10,y10) ]
新しい二変量ガウス分布を作成するには:
N1((x1,x2), I), N2((x2,y2), I), ..., N10((x10,y10), I)
彼らは、正規分布する 10 個のランダム平均を選択する簡単な方法として、初期二変量ガウス分布 N((1,0), I) を使用しているだけです。