トレーニング用とテスト用の 2 つのデータセットがあります。テスト データ セットの数値型の列の値を予測します。インスタンスの値を予測するには、トレーニング データ セットでそのインスタンスの k 個の最近傍を見つけ、値の平均を計算する必要があります。(待機も使用できます)。
例えば:
column0 column1 column2
……a…………b…………10
…… ……a…………b…………12
…… c..................d.................................16
……a…………b…………?
結果 = (10+12)/2 = 11 を得るには、データ マイニングの方法が必要です。このような結果を得るには、どの方法を使用すればよいですか? また、その方法の使用方法を説明している適切なドキュメントを知っていますか?