2

機能選択のために主成分分析(PCA)を試しました。これにより、9つの機能のセットから4つの最適な機能が得られました(緑の平均、緑の分散、緑の標準分割、赤の平均、赤の分散、標準分割) . of Red, Mean of Hue, Variance of Hue, Std. div. of Hue, ie [ MGcorr,VarGcorr, stdGcorr,MRcorr,VarRcorr,stdRcorr,MHcorr,VarHcorr,stdHcorr ]) データを 2 つのクラスターに分類します。文献によると、PCA はあまり良い方法ではなく、むしろカーネル PCA (KPCA) を機能選択に適用する方がよいようです。機能選択に KPCA を適用したいのですが、次のことを試しました。

d=4; % number of features to be selected, or d: reduced dimension
[Y2 eigVector para ]=kPCA(feature,d); % feature is 300X9 matrix with 300 as number of  
                                      % observation and 9 features
                                      % Y: dimensionanlity-reduced data

上記の kPCA.m 関数は、http: //www.mathworks.com/matlabcentral/fileexchange/39715-kernel-pca-and-pre-image-reconstruction/content/kPCA_v1.0/code/kPCA.mからダウンロードできます 。

上記の実装では、9 つ​​の機能からどの 4 つの機能を選択するか (つまり、どの上位機能が最適か) を見つけてクラスタリングする方法を知りたいと考えています。

または、KPCA 実装のために次の関数も試しました。

options.KernelType = 'Gaussian';
options.t = 1;
options.ReducedDim = 4;
[eigvector, eigvalue] = KPCA(feature', options);

上記の実装でも、9 つの機能のセットから 4 つの上位 / 最適な機能を決定する際に同じ問題があります。

上記の KPCA.m 関数は、http: //www.cad.zju.edu.cn/home/dengcai/Data/code/KPCA.mからダウンロードできます 。

私の問題にカーネル PCA を実装するのを手伝ってくれる人がいれば、それは素晴らしいことです。

ありがとう

4

1 に答える 1

5

PCA はそれ自体最適な機能を提供しません。それが提供するのは、相関関係のない新しい一連の機能です。「最良の」4 つの特徴を選択すると、最大の分散 (最大の固有値) を持つものを選択することになります。したがって、「通常の」PCA の場合、4 つの最大固有値に対応する 4 つの固有ベクトルを選択するだけで、元の 9 つの特徴を行列乗算によってこれらの固有ベクトルに射影します。

カーネル PCA 関数用に提供したリンクから、戻り値はカーネル PCA 空間のY2最上位の機能に変換された元のデータのように見えるため、変換は既に行われています。d

于 2013-01-25T17:57:08.210 に答える