0

システムに k-nearest アルゴリズムを実装しました。これは、それぞれ 100 サンプルの 26 クラスから構成されます。私の場合、K=7 であり、最良の分類結果を得るために完全に試行錯誤を繰り返しました。

分類のノイズを減らすために、K を賢く選択する必要があることはわかっています。しかし、サンプル数はどうでしょうか。「サンプルが多いほど良い結果が得られる」などの一般的なルールはありますか? それは何かに依存していますか?

ご回答ありがとうございます。

4

1 に答える 1

0

データを生成している根本的なメカニズムや、問題に関する背景知識を検討してみてください。これにより、ノイズの相対的なサイズと根本的な変動のアイデアが得られる可能性があります。たとえば、お気に入りのスポーツ チームを場所から予測する場合、お気に入りのスポーツを予測するよりも大きな変化が予想されるため、小さい k を使用します。ただし、相互検証を使用することを除いて、一般的なガイダンスはあまり知りません。

于 2012-06-19T03:55:25.923 に答える