マーケット バスケット分析 (apriori()) を適用するために、以下に示すように 1 つのデータ セットを作成しました。
id name
1 mango
1 apple
1 grapes
2 apple
2 carrot
3 mango
3 apple
4 apple
4 carrot
4 grapes
5 strawberry
6 guava
6 strawberry
6 bananas
7 bananas
8 guava
8 strawberry
8 pineapple
9 mango
9 apple
9 blueberries
10 black grapes
11 pomogranate
12 black grapes
12 pomogranate
12 carrot
12 custard apple
いくつかのロジックを適用して、マーケット バスケット分析処理可能なデータに変換しました。
library(arules)
fact <- data.frame(lapply(frt,as.factor))
trans <- as(fact, 'transactions')
これも試してみましたが、エラーが発生しました。
trans1 = read.transactions(file = frt, format = "single", sep = ",",cols=c("id","name"))
Error in scan(file = file, what = "", sep = sep, quiet = TRUE, nlines = 1) :
'file' must be a character string or connection
得られた出力は期待どおりではありません。私が得た出力。
items transactionID
1 {name=mango} 1
2 {name=apple} 2
3 {name=grapes} 3
4 {name=apple} 4
5 {name=carrot} 5
6 {name=mango} 6
7 {name=apple} 7
8 {name=apple} 8
9 {name=carrot} 9
10 {name=grapes} 10
11 {name=strawberry} 11
12 {name=guava} 12
13 {name=strawberry} 13
14 {name=bananas} 14
私の期待される出力は
id item
1 {mango,apple,grapes)
2 {apple,carrot}
3 {mango,apple}
などなど
私の予想される出力を取得する方法を教えてください(可能であれば)
apriori() アルゴリズムを適用するのに役立ちます。
よろしくお願いします。