-1

.CSV ファイルにあるデータから、頻繁に使用される項目セットと関連付けルールをマイニングしようとしています。R の arules パッケージについて学び、それを使用することにしました。

CSV からのデータフレームの作成に関する問題に直面しています。

私の CSV ファイルには、基本的に次の形式のデータが含まれています。

transactionid,items
1,"milk,beer,diapers"
2,"coke,milk,eggs"
3,"diapers,eggs,coke"

データフレームを作成して apriori() または arules ライブラリの eact() 関数に渡すのを手伝ってくれる人はいますか?

ありがとう!

4

1 に答える 1

1

csvファイルからtransactionsオブジェクトにデータをインポートしたいようです。

df <- read.csv(text='transactionid,items
               1,"milk,beer,diapers"
               2,"coke,milk,eggs"
               3,"diapers,eggs,coke"',
               stringsAsFactors=FALSE)

library(arules)
lst        <- lapply(df$items,function(x)strsplit(x,split=",")[[1]])
names(lst) <- df$transactionid
trans      <- as(lst,"transactions")
inspect(trans)
#   items     transactionID
# 1 {beer,                 
#    diapers,              
#    milk}                1
# 2 {coke,                 
#    eggs,                 
#    milk}                2
# 3 {coke,                 
#    diapers,              
#    eggs}                3

機能も見てみる必要がありread.transactions(...)ます。

于 2015-09-27T05:34:03.810 に答える