2

次のデータセットがあり、2 つの変数 Color と Size が観測されているとします。

カラー | サイズ
------+------
赤 | 赤 | 大きい
ホワイト | 小さな
赤 | 赤 | 小さな
赤 | 赤 | 大きい
ホワイト | 大きい
赤 | 赤 | 大きい

以下に示すベイジアン ネットワークの最尤パラメーターを学習するよう求められます。

カラー -> サイズ

表に記載されている学習問題についてより多くのデータが得られますが、新しいデータセットには欠損値が含まれています。現在、最尤パラメータを学習するためにどのアルゴリズムを使用できますか?

4

1 に答える 1

4

値が欠落しているケースを単に捨てると、不正確な値が得られます。

したがって、代わりに確率を予測する必要があり、これには期待値最大化アルゴリズムを使用できます。http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm

于 2013-12-10T18:11:48.570 に答える