9

わかりました。たくさん検索したので、販売データに対してルールを実行したいと思います。データを適切な形式で適切に取得し、正しい「因子」または「変数」をバスケット形式で設定するだけです。

現在、注文番号とその中の商品の販売データがあります。各注文は一意ですが (すべての新しい注文、新しい # が作成され、部品番号が含まれます) が、明らかに同じアイテムが多くの注文に表示される可能性があります。

現在、私のデータは次のように設定されています。

注文番号 部品番号 部品の説明
1 パートA
1BパートB
1GパートG
2 RパートR
3 パートA
3BパートB
4 E PartE
5年パーティー
6 パートA
6BパートB
6FパートF
6VパートV

したがって、R はこの形式を好まないため、ルールとデータ分析が受け入れる形式で取得する必要があります。

はい、テキスト ファイルとして保存し、.csv ファイルを試しましたが、RStudio で準備または操作する方法について段階的な手順を取得できれば、それは素晴らしいことです。

..のようなバスケットの形であると思われると読みました。

1 (A, B, G)
2 (R)
3 (A, B)
4 (E)
5 (Y)
6 (A, B, F, V)

それが正確でない場合は、私を修正してください。アイデアはわかりましたが、どこにも見つからないように見えるステップバイステップの説明が必要です。dplyr と tidyr を使ってみました。私はデータ分析について十分に理解していますが、RStudio についてもっと直接的な支援が必要なので、そのステップバイステップを理解できれば、さらに理解を深めることができます。

4

2 に答える 2

8

データを取得する方法の例については、「トランザクション」データ型のヘルプ ページをご覧ください。

library(arules)
?transactions

あなたのタイプでは、split順序で並べ替えてから、それを使用asしてトランザクションリストに入れます。

trans <- as(split(data[,"Part"], data[,"Order"]), "transactions")
inspect(trans)
  items     transactionID
1 {A,B,G}   1            
2 {R}       2            
3 {A,B}     3            
4 {E}       4            
5 {Y}       5            
6 {A,B,F,V} 6   
于 2015-10-07T16:39:10.217 に答える
1

私は、強制 (たとえば、'as(dataname, "transactions"..) など) で多くの問題を抱えてきました。

これは、重複したレコード (つまり、データが「単一」形式の場合、同じトランザクションで同じ商品を複数回購入したこと) があるためだと思います。

これが最終的に私のために働いたものです:

Transactions<- read.transactions("Data with tx ids, item names, in
                      single format.csv", 
                      rm.duplicates= TRUE, sep=",",
                      format = "single", cols = c(7,9));

(7 列目に tx ID、9 列目に項目名)

于 2015-10-19T21:06:11.857 に答える