sparcl
Witten と Tibshirani が論文に基づいて作成したパッケージを使用しています。
Witten DM and R Tibshirani (2010) クラスタリングにおける特徴選択のフレームワーク。アメリカ統計学会誌 105(490): 713-726
関数の下の例を調べますHierarchicalSparseCluster
:
# Generate 2-class data
set.seed(1)
x <- matrix(rnorm(100*50),ncol=50)
y <- c(rep(1,50),rep(2,50))
x[y==1,1:25] <- x[y==1,1:25]+2
# Do tuning parameter selection for sparse hierarchical clustering
perm.out <- HierarchicalSparseCluster.permute(x, wbounds=c(1.5,2:6),nperms=5)
# Perform sparse hierarchical clustering
sparsehc <- HierarchicalSparseCluster(dists=perm.out$dists, wbound=perm.out$bestw, method="complete")
ここで確認するdim(sparsehc$dists)
と、4950 と 50 が返されます。シミュレーションの設定から、 と がわかりましn=100
たp=50
。また、マニュアルによると、戻り値dists
はdata matrixの(n*n)xpx
非類似度マトリックスです。4950 ではなく 100*100=10000 であるべきであるため、明らかに行の次元は n*n ではありません。どうもありがとうございました!