132 個の観測値と 10 個の変数で構成されるデータセットがあります。これらの変数はすべてカテゴリ変数です。観測がどのようにクラスター化され、分散のパーセンテージに基づいてどのように異なるかを確認しようとしています。つまり、a) 特定の観測点を互いに引き離すのに役立つ変数があるかどうか、b) ある場合、それによって説明される分散のパーセンテージは何かを調べたいと考えています。
データに対して PCoA (基本座標分析) を実行するように勧められました。ビーガンとサルのパッケージを使用して実行しました。これは、csv ファイルを r にロードした後のコードです。データと呼びます
#data.dis<-vegdist(data,method="gower",na.rm=TRUE)
#data.pcoa<-pcoa(data.dis)
次に、pcoa データからベクトルを抽出するように言われました。
#data.pcoa$vectors
その後、132行が返されましたが、20列の値が返されました(たとえば、軸1から軸20まで)
変数が 10 個しかないのに、値の列が 20 列ある理由に当惑しました。10列しか得られないという印象を受けました。a) ベクトルが実際に何を表しているのか、b) 軸 1 と 2 によって説明される分散のパーセンテージをどのように取得するのですか?
data.pcoa
私が持っていた別の質問は、距離行列で pcoa を実行した後に固有値を抽出する目的をよく理解していないということでしたが、それ以上の説明はありませんでした。