3

多次元データ (240 次元) の大規模なデータセットがあります。

私はデータ マイニングの初心者で、MATLAB を使用して線形判別分析を適用したいと考えています。しかし、ウェブ上で説明されている関数がたくさんあるのを見てきましたが、それらをどのように適用すればよいのかわかりません。

基本的にはLDAを適用したい。

このステップの後、自分のデータを再構築できるようにしたいと考えています。

これは手動で行うことができますが、既に最適化されている必要があるため、これを行うことができる事前定義された関数があるかどうか疑問に思っていました。

私の初期データは次のようなものです: size(x) = [2000 240]. つまり、基本的に 240 の機能 (ディメンション) と 2000 のデータ ポイントがあります。そして、このデータセットに対して LDA を実行したいと考えています。

4

2 に答える 2

3

Statistics Toolboxの関数classifyは、線形 (オプションを設定した場合は二次) 判別分析を行います。ドキュメントには、それがどのように使用されるべきかを説明するいくつかの実例があります: typedoc classifyまたはshowdemo classdemoto see それら。

クラスが 2 つしかない場合でも、観測値が 2000 個しかないことを考えると、240 個の特徴量は非常に多くなります。LDA の前に、PCA (「参考文献」を参照doc princomp) などの次元削減手法を適用するか、特徴選択手法 (doc sequentialfsそのような手法については「を参照」) を使用することができます。

于 2012-12-17T11:28:03.097 に答える
1

matlab 2014 で LDA を使用した分類に fitcdiscr を使用できます

于 2014-10-26T22:13:33.657 に答える