問題タブ [dimensionality-reduction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 円次元削減?
返される次元が円形になるような次元削減が必要です。
例) 12d のデータを 2d に減らし、0 と 1 の間で正規化すると、(0,0) は (.1,.1) と (.9,.9) と同じくらい近くなります。
私のアルゴリズムは何ですか?(Python実装のボーナスポイント)
PCAはデータの 2 次元平面を提供しますが、データの球面が必要です。
わかる?単純?固有の問題?ありがとう。
r - Rでpcaを適用した後、データセットの次元を減らします
私の質問は、R を使用して得られた主成分をどのように使用するかです。
主成分を取得したら、それを使用して次元を削減するにはどうすればよいでしょうか? 6 つの変数を含む data_set があり、k-means を使用してクラスター化する必要があります。6 つの変数でクラスタリングを実行すると、K-means によって散布図が得られます。pca は次元を減らすのに役立つので、k-means は実りある結果を生み出すことができると考えました。
主成分を取得するためにこれを行いました:
データセットの次元を減らすためにさらに進む方法を教えてください。
matlab - Matlab:クラスタリングの問題
k-means を使用してクラスター化された多次元データ セット データ セットに対して次元削減を実行する必要があります。データには、触覚グローブに配置されたセンサーのセンサー読み取り値から得られた正と負の実数が含まれています。データは、文字「A」を描くアクションを次のように表現しながらキャプチャされます。
今、私の混乱は
- 次のコードを使用して多次元データのクラスタリングを取得できません
これを修正する方法は?何が問題なのですか?
すべての次元でクラスターを取得した後、データをクラスター ラベルで次のように表します。
1 1 3 2
等々。
- このデータには、イベントの時間的な順序が組み込まれていますか? 一見するとそうですが、クラスタリングは時間的順序を考慮していないと言う論文があります。
- 長さを短くする必要があります。私は主成分分析を認識していますが、それは次元を選択するために使用され、データの長さを削減しません。入力テスト データ セットを使用した距離ベースの分類に、この短縮された形式を使用することは合理的ですか?
matlab - MATLAB で最初の主成分のみを取得するにはどうすればよいですか?
特定の測定では、行列から最初の主成分の数値のみを取得する必要があります。誰かが私にそれについてどうすればよいか教えてもらえますか?
matlab - セグメンテーションとリダクションにおけるクラスタリングの適用
行動認識の特徴である多次元時系列データがあります。3D ジョイント位置、クォータニオン値、平均、ジョイント間のユークリッド距離を表す 20 個の変数があります。k=4 で kmeans クラスタリングを適用しました。クラスタリングの後、共起するクラスタ ID を組み合わせて、それらに対応するデータ ポイントもそのクラスタ ID によってまとめられるようにしたいと考えています。たとえば、10 個のデータ サンプルの次のクラスター インデックスを考えると、
データを次のようにします。ここで、A、B、C、D、E、F、G、H は 3 つの特徴変数で、(AC) は特定の関節の (x、y、z) 座標を表し、D はユークリッドを表します。ヘッドに対するジョイントの距離(EH)は、ジョイントのクォータニオン値です。数値を要素とします。Data =
次に、結果は削減されたベクトル (データの圧縮バージョン) になり、データの最初の 2 行はクラスター ID 1 で表され、データの 3 行目はクラスター ID 2 で表され、4 行目 = 1、5 行目、6 行目、7 行目です。行が結合され、3、8、9 行目が 2、最後の行が 4 で表されます。したがって、最終的なデータ表現は、次元と長さも縮小された圧縮文字列になりますCompressed_Data = [1 2 1 3 2 4]'
。このマッピングと変換を行うにはどうすればよいですか? 前もって感謝します。
python - 内積の相対値を維持する射影を見つけるにはどうすればよいですか?
100 次元のベクトル v で次元削減を行い、10 次元のベクトル v' を取得します。
また、以下のプロパティを保持する必要があります。
ランダム射影は方法 ( http://scikit-learn.org/stable/modules/random_projection.html ) であることを学びましたが、距離と内積の値を保持します。しかし、絶対距離/内積値ではなく、相対的な > または < プロパティのみを保持したいのです。
ランダム投影のもう 1 つの問題は、大幅な次元削減 (10000 ~ 3000) に適していることです。
以下は、必要なものを説明するための私の Python-Pseudo-Code です。
matlab - Matlab で PCA を使用してトレーニング データの次元を削減する
これはフォローアップの質問です:
新しい 10 次元のテスト データを分類するには、トレーニング データも 10 次元に減らす必要がありますか?
私は試した:
しかし、これと 10 次元のテスト データで分類器を使用すると、非常に信頼できない結果が得られますか? 私が根本的に間違っていることはありますか?
編集: