R でパッケージを使用してアソシエーション ルールを見つけようとしてarules
います。csv ファイルを使用してトランザクション オブジェクトを作成しています。間違ったアイテム セットを取得しています。データはこんな感じ
137,lidocaine
138,pregabalin
139,esomeprazole,nadolol,atorvastatin
140,hydromorphone
141,ondansetron,enoxaparin,metoclopramide
142,fluticasone
143,trandolapril,amlodipine,fluticasone,esomeprazole
144,meloxicam
145,lidocaine
146,atorvastatin
147,fluticasone
here is the R code I am using
library("arules")
txn <- read.transactions("basket.csv", rm.duplicates= TRUE,format="basket",sep=",",cols =1);
txn@itemInfo
The item list I am getting has repeated items
labels
1 amlodipine
2 atorvastatin"
3 enoxaparin
4 esomeprazole
5 esomeprazole"
6 fluticasone
7 fluticasone"
8 hydromorphone"
9 lidocaine"
10 meloxicam"
11 metoclopramide"
12 nadolol
13 ondansetron
14 pregabalin"
15 trandolapril
項目 4 と 5 を見ると、それらは同じですが、引用符のために異なる扱いになっています。項目 6 と 7 の場合も同様です。
これを解決する方法、またはこれが起こっている理由はありますか?