科学データから生成されたデータ マトリックスをクラスター化しようとしています。クラスタリングをどのように実行したいかはわかっていますが、R でこの偉業を達成する方法がわかりません。
データは次のようになります。
A1 A2 A3 B1 B2 B3 C1 C2 C3
sample1 1 9 10 2 1 29 2 5 44
sample2 8 1 82 2 8 2 8 2 28
sample3 9 9 19 2 8 1 7 2 27
A1、A2、A3 は 1 回の処理の 3 つの複製であると考えてください。B と C も同様です。Sample1 は異なるテスト変数です。したがって、列間のすべての違いを確認するために、このマトリックスを階層的にクラスター化したいと思います。具体的には、列の関連性を観察するためにデンドログラム (ツリー) を作成します。
このようなものを適切にクラスター化する方法を知っている人はいますか? 私はこれでこれをやってみました:
raw.data <- read.delim("test.txt",header=FALSE,stringsAsFactors=FALSE)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)
...しかし、これにより、各列ではなく、サンプル変数ごとに枝を持つツリーが作成されました。ご提案ありがとうございます。