1

WEKA (分類問題) で次元削減のために PCA を実行しようとしています。

データには 200 個の属性があり、2100 行近くあります。

ここに私が従う手順があります

  • WEKA エクスプローラーで csv ファイルをインポートする

  • 前処理タブで、適用、データの正規化 (データ全体を [0,1] の範囲に入れるには

  • 次に、PCA を実装します。

    • PCA のオプションには、centerData のオプションがあり、False に設定すると、データを標準化した後に相関行列を使用して計算し (間違っている場合は訂正してください)、true に設定すると共分散行列を使用します。

私の疑問は

  1. PCA を実装する前にデータを正規化する必要がありますか? 正規化の前後で試してみましたが、結果が異なります。だから私は混乱しています。
  2. データを標準化 (平均を 0 にする) してから、PCA を適用する必要があります。

どちらの場合でも、centerData オプションの PCA WEKA で選択する必要があるオプションは何ですか?

4

1 に答える 1