需要予測プロジェクトの範囲内で、トップダウン予測アルゴリズムを適用できるように、互いに類似している時系列をグループ化する最良の方法を決定したいと考えています。現時点での私の主な質問は、適切なグループとは何か、それらのグループの適切な階層は何かを判断することです。いくつか読んだ後、Dynamic Time Warping が役立つ可能性があると思います。これをテストするために、小さなテスト ケースを作成しましたが、1 つの問題に直面しています。これは、たとえばテキスト ツリーなどで階層を抽出する方法です。多分あなたの一人が私をさらに助けてくれることを願っています。
私が得たものを示すために、次のケースを作成しました。
sc2 <- read.table("http://dl.dropbox.com/u/9641130/R/hclust.data", header=F, sep="")
SampleLabels <- c("ID1", "ID2", "ID3", "ID4", "ID5", "ID6", "ID7", "ID8", "ID9", "ID10", "ID11", "ID12", "ID13", "ID14", "ID15")
distMatrix2 <- dist(sc2, method="DTW")
hc2 <- hclust(distMatrix2, method="average")
# show the visual tree
plot(hc2, labels=SampleLabels)
どういうわけか、クラスターの名前とメンバーをテキストで取得して、引き続き作業できるようにしたいと思います。誰でもアイデアはありますか?
ありがとう!