0

arules パッケージでは、例の食料品データセットなどのトランザクション データを読み取ることができます。

groceries <- read.transactions("groceries.csv", sep = ",", rm.duplicates=T)

次に、トランザクションを調べると、次のようになります。

inspect(groceries[1:3])

items                
1 {,                   
   citrus fruit,       
   margarine,          
   ready soups,        
   semi-finished bread}
2 {,                   
   coffee,             
   tropical fruit,     
   yogurt}             
3 {,                   
   whole milk} 

ご覧のとおり、各トランザクションの最初の項目は空白であると考えています。次のようになります。

 items                
1 {citrus fruit,       
   margarine,          
   ready soups,        
   semi-finished bread}
2 {coffee,             
   tropical fruit,     
   yogurt}             
3 {whole milk} 

上記の正確なコードを使用する例ではこの問題が発生しないため、R の最新バージョンで何かが変更されたかどうかはわかりません。

これは、生の csv ファイルがエディターでどのように見えるかです (最初の 2 行):

citrus fruit,semi-finished bread,margarine,ready soups,,,,,,,,,,,,,,,,,,,,,,,,,,,,
tropical fruit,yogurt,coffee,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

末尾のコンマがあるのには理由があります...これは、この行 (トランザクション) のアイテムが、最も多くのアイテムを持つトランザクションよりも少ないことを示しています。しかし、問題を引き起こしているのはこれらのコンマです。

これらの空白がアイテムであると見なすルールパッケージなしで、この csv ファイルを読み取るにはどうすればよいですか?

4

0 に答える 0