MATLAB で独自のコードを記述して、単純ベイズ アルゴリズムを実装しようとしています。連続属性の 1 つにどの分布を選択するか混乱しました。次のような値があります。
MovieAge :
1
2
3
4
..
10
1
11
2
12
1
3
13
2
1
4
14
3
2
5
15
4
3
6
16
5
4
....
32
9
3
15
そのようなデータに使用するディストリビューションを教えてください。私のテスト セットでは、この属性にはトレーニング データに含まれていない値が (場合によっては) 含まれます。この問題をどのように処理しますか?ありがとう 15