4

科学データから生成されたデータ マトリックスをクラスター化しようとしています。クラスタリングをどのように実行したいかはわかっていますが、R でこの偉業を達成する方法がわかりません。

データは次のようになります。

            A1     A2     A3     B1     B2     B3     C1     C2     C3
sample1      1      9     10      2      1     29      2      5     44
sample2      8      1     82      2      8      2      8      2     28
sample3      9      9     19      2      8      1      7      2     27

A1、A2、A3 は 1 回の処理の 3 つの複製であると考えてください。B と C も同様です。Sample1 は異なるテスト変数です。したがって、列間のすべての違いを確認するために、このマトリックスを階層的にクラスター化したいと思います。具体的には、列の関連性を観察するためにデンドログラム (ツリー) を作成します。

このようなものを適切にクラスター化する方法を知っている人はいますか? 私はこれでこれをやってみました:

raw.data <- read.delim("test.txt",header=FALSE,stringsAsFactors=FALSE)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)

...しかし、これにより、各列ではなく、サンプル変数ごとに枝を持つツリーが作成されました。ご提案ありがとうございます。

4

1 に答える 1

4

データセットを転置するだけです:

raw.data <- t(raw.data)
require(vegan)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)
于 2013-08-08T19:11:33.693 に答える