WEKA (分類問題) で次元削減のために PCA を実行しようとしています。
データには 200 個の属性があり、2100 行近くあります。
ここに私が従う手順があります
WEKA エクスプローラーで csv ファイルをインポートする
前処理タブで、適用、データの正規化 (データ全体を [0,1] の範囲に入れるには
次に、PCA を実装します。
- PCA のオプションには、centerData のオプションがあり、False に設定すると、データを標準化した後に相関行列を使用して計算し (間違っている場合は訂正してください)、true に設定すると共分散行列を使用します。
私の疑問は
- PCA を実装する前にデータを正規化する必要がありますか? 正規化の前後で試してみましたが、結果が異なります。だから私は混乱しています。
- データを標準化 (平均を 0 にする) してから、PCA を適用する必要があります。
どちらの場合でも、centerData オプションの PCA WEKA で選択する必要があるオプションは何ですか?