データセット (列 1 = 遺伝子名、列 2 = 発現値) を使用しており、クラスター プロットを実行しようとしていますが、列の遺伝子 ID ではなく行番号で枝がラベル付けされていることがわかりました。 1.
データセット: https://dl.dropbox.com/u/364456/miRNA.csv
使用:
attach(animals)
d=dist(as.matrix(animals))
hc=hclust(d)
plot(hc)
結果のプロット:
kmeans クラスタリングを実行しようとしましたが、最終的にこのエラーが発生しました。
強制によって導入された NA。
これは、データ ファイルを正しくフォーマットしていないことを示しています。
ここで何が起こっているか知っている人はいますか?