arulesSequences
R でパッケージを使用しています。ドキュメントは、read_baskets
関数が受け取るデータの種類に対して少なすぎます。データはテキスト (.txt) 形式にする必要があると思います。列名は、「sequenceID」、「eventID」、「SIZE」、および「items」です。私のデータには約 200,000 行あり、z.txt ファイルでは次のようになります。
1,1364,3,{12,17,19}
1,1130,4,{14,17,21,23}
1,1173,3,{19,23,9}
1,98,5,{14,15,2,21,5}
2,1878,4,{1,10,14,3}
2,1878,13,{1,12,14,15,16,17,18,19,2,21,24,25,5}
2,1878,1,{2}
私は使用しようとしました:
x <- read_baskets("z.txt", sep = ",",info =c("sequenceID","eventID","SIZE"))
s <- cspade(x,parameter = list(support = 0.001),control = list(verbose =
TRUE),tmpdir = tempdir())
しかし、私はこのエラーが発生します:
makebin(data, file) のエラー: 'sid' が無効です