1

データセットを正しく処理すると、LibSVM の分類精度が劇的に向上するという論文を読みました... Weka の実装を使用しており、データセットが最適であることを確認するための助けが必要です。

これが私の(例の)属性です:

Power Numeric (real numbers, range is from 0 to 1.5132, 9000+ unique values)
Voltage Numeric (similar to Power)
Light Numeric (0 and 1 are the only 2 possible values)
Day Numeric (1 through 20 are the possible values, equal number of each value)
Range Nominal {1,2,3,4,5} <----these are the classes

私の質問は、このデータセットを LibSVM でより効果的にするには、どの Weka 前処理フィルターを適用すればよいですか?

  1. 電力と電圧のデータ値を正規化または標準化する必要がありますか?
  2. 何かに離散化フィルターを使用する必要がありますか?
  3. 電力/電圧値をより少ない数のビンにビニングする必要がありますか?
  4. 光の値を数値ではなくバイナリにする必要がありますか?
  5. 日の値を正規化する必要がありますか? それをするのは理にかなっていますか?
  6. クラス「Range」に対して、Nominal to Binary または Nominal to some other フィルターを使用する必要がありますか?

これらの質問と、私が見逃していると思われるその他の質問についてアドバイスをお願いします...

前もって感謝します!!

4

1 に答える 1