1

私は機械学習を始めており、最近は線形判別分析を使用した線形分離可能なデータの分類について研究しています。そのために、scikit-learn パッケージと関数を使用しました

.discriminant_analysis.LinearDiscriminantAnalysis

手書き数字の MNIST データベースからのデータについて。データベースを使用してモデルに適合させ、次のようにしてテストデータの予測を行いました。

LDA(n_components=2)
LDA_fit(data,labels)
LDA_predict(testdata)

これはうまく機能します。95% という素晴らしい精度が得られます。ただし、predict 関数は 784 次元すべて (28x28 ピクセルの画像に対応) からのデータを使用します。予測にすべてのディメンションが使用される理由がわかりません。

線形判別分析の目的は、理想的にはデータが線形分離可能で分類が容易になるように、クラス分離を最大化できる低次元空間への射影を見つけることだと思います。

とにかく784次元すべてが予測に使用される場合、LDAのポイントと射影行列の決定は何ですか?

4

3 に答える 3