2

現在、Matlab の k 最近傍分類器 (knnclassify) を使用して、バイナリ属性のトレーニングとテストを行っています。何も指定されていない場合の k のデフォルト値引数は 1 であり、k の他の値を選択できます。私はオンラインとstackoverflowで調査を行いましたが、kのどの値が最適かという私の質問に対処するために関連するものは何もありませんでした。私の特定のデータについてそれを教えてくれる組み込み関数はありますか、それとも単に推測してどの程度の精度が得られるかを待つだけですか? どんな助けでも大歓迎です。

matlab の knnclassify ドキュメントへのリンクは次のとおりです: knnclassify

4

1 に答える 1

5

ここにあるのは、典型的なモデル選択の問題です。k必要なのは、データの全体的なエラーが最も少ない を選択することです。k の値が大きいほど一般化が進み、値が小さいほどオーバーフィットする傾向があります。

したがって、クロス検証はこのパラメーターを選択するための良い方法であり、合理的な方法のように思われるこの記事を見つけました。

于 2013-02-20T04:36:02.393 に答える