1

K Nearest Neighbor Algorithm の K の最適値を見つけようとしています。さまざまな数のクラスメンバーに対してMatlabでこの分類方法を実行していますが、さまざまなKの値を使用する場合のエラー率を計算する必要があります。このアイデアを例として使用しようとしています:

次のデータセットがあります。

1 3 1

2 3 2

2 1 2

3 3 2

3 4 1

3 3 2

2 2 2

最初の列が x 軸、2 番目の y 軸が 3 番目の列はクラスのラベルで、K-NN アルゴリズムを使用して点 (x,y) を分類する必要があります。K の異なる値を使用しています。私の質問は、そのポイント (4,1) がソース データセットに含まれていないことがわかっているが、それがクラス ラベル 1 からのものであることを知っているかどうかです。 Leave-one-out-cross-validation メソッドに基づく特定の K 値。

よろしくお願いします

よろしく

リナディ

4

1 に答える 1

3

leave-one-out 交差検証とは、単純に、 model 、サイズのmトレーニング セット、およびいくつかの評価メトリック (エラー測定)が与えられた場合、次のように進めることを意味します。TnE

  1. (x,y)からの各ポイントT:
    1. mモデルをトレーニングしますT\(x,y)(1 で取得したポイントを除くすべてのポイント)。
    2. をチェックE( m , (x,y) )します。たとえば、与えられたを正しくm決定できるか (その場合=0)、そうでないか (および=1)をチェックします。yxEE
  2. E分析されたすべてのポイントのすべての値の平均を計算します

結果として、平均汎化誤差推定値が得られます。モデルが 1 つのポイントのラベルをどれだけうまく予測できるかを確認し、残りのトレーニング セットでトレーニングしました。

于 2013-10-06T05:37:44.823 に答える