したがって、 kNNは、教師あり機械学習モデルを構築/テストするための一般的なワークフローの例外です。特に、kNN を介して作成されたモデルは、メトリック空間に配置された利用可能なラベル付きデータにすぎません。
つまり、kNN の場合、構築するモデルがないため、トレーニング ステップはありません。kNN で行われているのは、テンプレート マッチングと補間だけです。
検証ステップもありません。検証では、トレーニング データに対するモデルの精度を反復回数 (トレーニングの進行状況) の関数として測定します。オーバーフィッティングは、この経験的曲線の上向きの動きによって証明され、トレーニングを中止すべきポイントを示します。つまり、モデルが構築されていないため、検証するものは何もありません。
ただし、ターゲット (ラベルまたはスコア) がモデルから隠されているデータを使用して、予測の品質を評価することはできます。
しかし、kNN と他の教師あり機械学習手法では、テストでさえ少し異なります。特に、kNN の場合、予測の質はもちろんデータ量、より正確には密度 (単位体積あたりのポイント数) に依存します。それに最も近い点がある場合は、予測したい点に近い点があると役立ちます。したがって、テスト セットのサイズを小さく保つか、k 分割交差検証または 1 つを除外する交差検証を使用することをお勧めします。どちらも、より完全なモデル テストを提供しますが、サイズを縮小するという犠牲はありません。あなたのkNN近隣人口。