0

私は現在、気象要因 (13 要因) に基づいて地域の果実収量を予測するために、ANN、SVM、および線形回帰法の適用に取り組んでいます。合計データセットは次のとおりです: 36

WEKA でこれらのメソッドを実装している間、悪い結果が得られます: MultilayerPreceptron の場合と同様に、私の結果は次のとおりです: (データセットをトレーニング用に 28 に、テスト用に 8 に分割しました) === 実行情報 ===

スキーム: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a -G -R 関係: apr6_data インスタンス: 28 属性: 15

モデルの構築にかかった時間: 3.69 秒

=== テスト セットの予測 ===

Inst#実際の予測エラー1 2.551 2.36 -0.191 2 2.126 3.079 0.953 3 2.6 1.319 -1.281 4 1.901 3.539 1.638 5 2.146 3.635 1.489 6 2.533 2.917 0.384 7 2.54 2.744 0.204 8.204 8.204 8.204 82.82 3.473 0.653

=== テストセットでの評価 === === まとめ ===

相関係数 -0.4415 平均絶対誤差 0.8493 二乗平均平方根誤差 1.0065 相対絶対誤差 144.2248 % 相対二乗平方根誤差 153.5097 % インスタンスの総数 8

回帰のSVMの場合:Inst#実際の予測エラー1 2.551 2.538 -0.013 2 2.126 2.568 0.442 3 2.6 2.335 -0.265 4 1.901 2.556 0.655

=== テストセットでの評価 === === まとめ ===

相関係数 0.2888 平均絶対誤差 0.3417 二乗平均平方根誤差 0.3862 相対絶対誤差 58.0331 % 相対二乗平方根誤差 58.9028 % インスタンスの総数 8

アプリケーションで考えられるエラーは何ですか? 私にお知らせください !ありがとう

4

1 に答える 1

0

データを正規化する必要がありますか? WEKA分類器によって行われていると思います。

データを正規化したい場合は、それを行う必要があります。[前処理] タブ - > [フィルター] (選択) -> [正規化] を見つけて、[適用] をクリックします。

データを離散化する場合は、同じプロセスに従う必要があります。

低/中/高利回りなど、予測を離散化することで運が良くなる可能性があります。

正規化または離散化する必要があります-これは、データまたは単一の実行に基づいて言うことはできません. たとえば、離散化はナイーブ ベイの分類器により良い結果をもたらします。SVMの場合-わかりません。

データから精度、再現率、または F スコアを確認できませんでした。しかし、テストセットで悪い結果が得られたと言っているように、分類子がオーバーフィッティングを経験している可能性が非常に高いです。トレーニング インスタンスを増やしてみてください (36 は少なすぎると思います)。トレーニング インスタンスを増やしたときに何が起こっているかを投稿し続けてください。

于 2012-04-08T22:30:34.100 に答える