1

トレーニング用とテスト用の 2 つのデータセットがあります。テスト データ セットの数値型の列の値を予測します。インスタンスの値を予測するには、トレーニング データ セットでそのインスタンスの k 個の最近傍を見つけ、値の平均を計算する必要があります。(待機も使用できます)。

例えば:

column0 column1 column2

……a…………b…………10
…… ……a…………b…………12
…… c..................d.................................16

……a…………b…………?

結果 = (10+12)/2 = 11 を得るには、データ マイニングの方法が必要です。このような結果を得るには、どの方法を使用すればよいですか? また、その方法の使用方法を説明している適切なドキュメントを知っていますか?

4

1 に答える 1

5

Weka の KNN は IBk として実装されています。数値および公称値を予測できます。

Weka Explorer (GUI) を使用している場合は、[分類] タブの下にある [選択] ボタンを探して見つけることができます。そこに移動したら、フォルダーを移動します。

分類子 -> 遅延 -> IBk

IBk を選択したら、ボタンのすぐ右にあるボックスをクリックします。これにより、多数のオプションが開かれます。オプション ウィンドウの [詳細] ボタンをクリックすると、すべてのオプションの説明が表示されます。分類子の説明がさらに必要な場合は、分類子が基づいている学術論文もリストされています。すべての分類子に対してこれを実行して、追加情報を取得できます。

于 2013-11-13T18:54:37.627 に答える