問題タブ [pca]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python での主成分分析
次元削減に主成分分析 (PCA) を使用したいと思います。numpy または scipy には既にそれがありますか、それとも を使用して自分でロールバックする必要がありnumpy.linalg.eigh
ますか?
入力データが非常に高次元 (〜 460 次元) であるため、特異値分解 (SVD) を使用したくないだけなので、SVD は共分散行列の固有ベクトルを計算するよりも遅くなると思います。
どのメソッドをいつ使用するかについてすでに正しい決定を下し、おそらく私が知らない他の最適化を行う、事前に作成されたデバッグ済みの実装を見つけたいと思っていました。
r - Rで主成分分析を行うときに、最初にデータマトリックスを標準化する方がよいかどうかをどのように判断しますか?
Rで主成分分析を行おうとしています。それを行うには2つの方法があると私は信じています。1つは、主成分分析をすぐに実行する方法です。もう1つは、最初にs = scale(m)を使用してマトリックスを標準化し、次に主成分分析を適用することです。
どの結果が優れているかをどのように判断できますか?特にどのような値を見る必要がありますか。私はすでに、両方の方法を使用して、固有値と固有ベクトル、各固有ベクトルの分散の比率を見つけることができました。
標準化されていない最初の主成分分析の分散の比率の値が大きいことに気づきました。意味はありますか?これは常にそうではありませんか?
最後に、変数、つまり重みを予測することになっている場合、主成分分析を行うときに、変数、つまり重みをデータマトリックスから削除する必要がありますか?
r - Rで2つの主成分を持つ線形回帰モデルを適合させる方法は?
データ行列 d があるとしましょう
では、これは線形回帰モデルに適合するはずですよね?
しかし、私はこのエラーが発生します:
これを自動的に行うパッケージがあると思いますが、これも機能するはずですか?
r - Rですべてのサンプル主成分プロットを表示するには?
私はRで何かに気づきました。たとえばpc
、PCAをデータ行列に適用した結果であり
pc$x
、私のサンプルの主成分行列です。
を試すとplot(pc$x)
、最初の主成分 ( pc1
) と 2 番目の主成分 ( ) のみがプロットされますpc2
が、実際には 2 つ以上の主成分があります。それらをすべて表示するにはどうすればよいですか?
math - 主成分分析と因子分析
主成分分析と因子分析について質問があります。
PCAの場合、固有値が共分散行列と相関行列のどちらから計算されるかは重要ですか?また、FAについては、共分散または相関行列Éを使用した場合、固有値の結果は同じですか?
matlab - MATLAB での SVM の可視化
Matlab で SVM トレーニングを実行したら、SVM 分類を視覚化するにはどうすればよいですか?
これまでのところ、SVM を次の方法でトレーニングしただけです。
matlab - MATLAB のメモリが不足していますが、そうではありません
標準化されたを使用して、データにPCAを適用しようとしprincomp(x)
ています。
データは<16 x 1036800 double>
. これは、これが新しいコンピューターであるという事実を除いて、あまりにも予想されるメモリを実行します。コンピューターはデータマイニング用に 24GB の RAM を保持します。MATLAB は、メモリ チェックで使用可能な 24GB を一覧表示します。
PCA の実行中に MATLAB が実際にメモリ不足になっているのか、それとも MATLAB が RAM を最大限に活用していないのか? どんな情報やアイデアも役に立ちます。(仮想メモリを増やす必要があるかもしれませんが、24GB で十分だと思います。)
php - PCA での C++ と PHP のパフォーマンス
PCA (主成分分析) を実行する際に、C++ と PHP のどちらが効率的かを教えてください。
PHPでアップロードされた画像を取得し、画像を処理してPCAで画像を分析し、画像がデータベースに既に保存されている別の画像と一致するかどうかを確認できるWebベースのシステムを開発しています。
しかし、 PCAタスクを完了するためのパフォーマンスを向上させるために、どの言語( C++、PHP、またはその他のより優れた代替手段)を使用するべきか疑問に思っています。
tq~
algorithm - PCA: このアルゴリズムの何が問題なのですか?
最初の主成分を計算するためのこのウィキペディアのアルゴリズムを誰かが確認または修正できますか? PCA AFAIK用の既存のライブラリがないDでのPCAの簡単な実装が必要です。これを実装しようとしましたが、単純な例での結果が、R または Octave から取得したものと一致しないようです。実装を何度かチェックし、最初から書き直したので、実装のバグではないと確信しています。これは非常に単純なアルゴリズムです。
algorithm - 500,000 点の 100 次元空間で最も近い 2 点を見つける方法は?
100 次元空間に 500,000 点のデータベースがあり、最も近い 2 点を見つけたいと考えています。どうすればいいのですか?
更新: スペースはユークリッドです。申し訳ありません。そして、すべての答えに感謝します。ところで、これは宿題ではありません。