1

arulesSequencesR でパッケージを使用しています。ドキュメントは、read_baskets関数が受け取るデータの種類に対して少なすぎます。データはテキスト (.txt) 形式にする必要があると思います。列名は、「sequenceID」、「eventID」、「SIZE」、および「items」です。私のデータには約 200,000 行あり、z.txt ファイルでは次のようになります。

1,1364,3,{12,17,19}
1,1130,4,{14,17,21,23}
1,1173,3,{19,23,9}
1,98,5,{14,15,2,21,5}
2,1878,4,{1,10,14,3}
2,1878,13,{1,12,14,15,16,17,18,19,2,21,24,25,5}
2,1878,1,{2}

私は使用しようとしました:

x <- read_baskets("z.txt", sep = ",",info =c("sequenceID","eventID","SIZE"))
s <- cspade(x,parameter = list(support = 0.001),control = list(verbose = 
TRUE),tmpdir = tempdir())

しかし、私はこのエラーが発生します:

makebin(data, file) のエラー: 'sid' が無効です

4

2 に答える 2

0

OK、問題を見つけました。誰かが同じ問題を抱えている場合に備えて投稿しています。問題は、SequenceID と eventID の両方です (最初と 2 番目の列はブロック単位で並べる必要があります。パッケージにはこの点が記載されていますが、最初の列のみを並べ替えました。

于 2015-07-22T21:14:49.113 に答える