各シーケンスに数百のイベントがあるデータセットを使用しています。を使用して、サブシーケンスとシーケンシャル アソシエーション ルールを識別しようとしていますTraMineR
。たとえば、私が書くコードは次のとおりです。
# Frequent subsequences:
fsubseq <- seqefsub(weaver, minSupport = 0.05, maxK = 4)
fsubseq <- seqentrans(fsubseq)
fsb <- fsubseq[fsubseq$data$nevent > 1]
plot(fsb[1:20], col = "cyan")
# Sequential association rules:
rules <- TraMineR:::seqerules(fsubseq)
rules[order(rules$Lift, decreasing = TRUE)[1:25], 1:4]
これは、maxK を 1 ~ 3 に設定している限り、通常は実行可能ですが、その値を超えると、計算に数日ではなくても数時間かかります。これらの計算を高速化するために調整できる特定のパラメーターはありますか?