0

これは、非パラメトリック密度推定に関するものです。

したがって、「良いデータ」の 220 値と「壊れたデータ」の 30 値の 2 つの異なるデータがあり、推定 p(x |c="良いデータ") には k 最近傍密度推定を使用する必要があります。

k=5 の場合、p(x |c=good) =(5/220)*(1/V) となります。

私の理解が正しければ、k-nearest-neighbour によって V を決定し、p(x |c=good) を取得する必要があります。5 点の V を見つけなければならない場合、p(x|c=good) を解くことができます。

この確率をプロットして計算する方法に問題があります。本からの写真があり ます http://content.foto.mail.ru/mail/zurix/_mypagephoto/h-67.jpg K最近傍密度推定のグラフで青い曲線は何を意味しますか(添付を見ることができます)?この曲線は異なる V の境界を示すことができますか? はいの場合、正確にクラス間の境界はどこで、各クラスは 5 つのポイントで構成されていますか???

前もって感謝します!!

4

1 に答える 1

0

図のキャプションや本のタイトルなどの追加情報がなければ、2 つの曲線が何を意味するのかを推測することは困難です。

私の推測では、緑色の曲線は、データ ポイントのサンプルが抽出された真の (1 次元の) 密度です。青い曲線は、 k の 3 つの異なる値に対する結果の密度推定関数のようです。

これは、k を適切に選択することの重要性を示しているはずです。k = 1 の場合、これはデータを過度に適合させます (結果として得られる密度推定関数の大きな分散)。 ) 0.3 付近のバンプを再現しないためです。

実際、k=1 の例を見ると、これは純粋な 1 / V ではなく、何らかの重み関数を使用しているように見えます。ポイントごとの純粋な 1/V 推定値の場合、区分定数関数 (水平線のみ) を期待します。

于 2013-06-03T07:17:46.430 に答える