クラスター アルゴリズムを適用する予定の数値属性とカテゴリ属性を含むデータ型が混在しています。
最初のステップとして、daisy() 関数と Gower 距離測定を使用して距離行列を作成しました。R でヒートマップとレベルプロット関数を使用して距離行列を表示しました。
データ内の一部のオブジェクト間に強い類似性があるように思われます。類似/非類似のオブジェクトのいくつかをチェックして、自分のデータでメジャーが適切に機能していることを確認したいと考えています。
ヒートマップから類似/非類似のオブジェクトを選択し、それらを元のデータ セットにリンクして評価できるようにするにはどうすればよいですか?
これは、R を使用してヒートマップをプロットする方法です。IDX は距離マトリックスです。
new.palette=colorRampPalette(c("black","yellow","#007FFF","white"),space="rgb")
levelplot(IDX_as[1:ncol(IDX_as),ncol(IDX_as):1],col.regions=new.palette(20))
quartz(width=7,height=6) #make a new quartz window of a given size
par(mar=c(2,3,2,1)) #set the margins of the figures to be smaller than default
layout(matrix(c(1,2),1,2,byrow=TRUE),widths=c(7,1)) #set the layout of the quartz window. This will create two plotting regions, with width ratio of 7 to 1
image(IDX_as[1:ncol(IDX_as),ncol(IDX_as):1],col=new.palette(20),xaxt="n",yaxt="n") #plot a heat map matrix with no tick marks or axis labels
axis(1,at=seq(0,1,length=20),labels=rep("",20)) #draw in tick marks
axis(2,at=seq(0,1,length=20),labels=rep("",20))
#adding a color legend
s=seq(min(IDX_as),max(IDX_as),length=20) #20 values between minimum and maximum values of m
l=matrix(s,ncol=length(s),byrow=TRUE) #coerce it into a horizontal matrix
image(y=s,z=l,col=new.palette(20),ylim=c(min(IDX),max(IDX)),xaxt="n",las=1) #plot a one-column heat map
heatmap(IDX_as,symm=TRUE,col=new.palette(20))