Bill_Number、Item_Name、Quantity という変数を持つデータセットがあります。1 つの Bill_Number の下に複数の Item_Name を含めることができます。Bill_Number と Quantity で要約しようとしています。ここで、Item_Names は請求書番号ごとに 1 つの変数に連結されます。ここでの解決策:いくつかの行変数を組み合わせると、限定された事前定義されたフレーム(以下に示すように)でうまく機能しますが、何百ものItem_Namesがあります。これを行う簡単な方法があると確信しています。誰でも助けてもらえますか?
データ (サンプルのみ):
BillN<-c('B1','B1','B1','B1','B2','B2','B2','B2','B3','B3','B3','B3')
Item_Name<-c('Prod A','Prod B','Prod C','Prod D','Prod A','Prod B','Prod C','Prod D','Prod A','Prod B','Prod C','Prod D') # going on to Product(n)
Quantity<-c(1,2,1,2,1,2,1,1,1,2,1,1)
出力: 使用ply::ddply
ddply(within(Dummy1, {
Item_Name <- ifelse(Item_Name %in% c('Prod A','Prod B','Prod C'), 'Prod A + Prod B + Prod C', 'Prod D')
}), .(BillN, Item_Name), summarise, Count=sum(Quantity))
これは、「製品 D」が別の行であることに依存しますが、特定の番号のすべての製品とその請求書番号の全体の数量の組み合わせが必要です。
必要な出力は次の形式です。
上記のコードから得られる出力は次のとおりです。
シナリオを拡張すると、各 Item_Name の Brand、Category、Sub_category などの変数と、それをさらに合計するための数値変数としての Sales_Amount があるとどうなりますか?
さらに詳しい情報が必要な場合や質問がある場合はお知らせください。
ありがとう、ラウル