顧客のリピート購入行動を分析しようとしています。
私の目標は 2 つあります。
- 1 回だけ発生するすべての顧客アイテムの郵便番号の組み合わせを削除します (繰り返しのないものを削除します)。
- 繰り返されるレコードについては、同じことを要約して、複数の注文間の平均日数と総売上高を取得する必要があります
次のデータがある場合:
Customer# Item Zip Date Qty Net Sales
--------- -------- ----- ---------- --- ---------
ABC123 GHTH123 76137 2014-01-01 10 1500
XYZ999 ZZZZZZZ 68106 2015-02-01 1 50
DEF456 167AAAA 60018 2015-03-01 12 650
XYZ999 YYYYYYY 68106 2015-01-01 3 150
XYZ999 ZZZZZZZ 68106 2015-04-01 10 500
XYZ999 YYYYYYY 68106 2015-03-01 12 600
XYZ999 YYYYYYY 68106 2015-05-01 10 500
ABC123 GHTH123 76137 2014-01-15 8 1200
ABC234 N867689 23218 2014-01-01 10 1500
ABC123 DDFF121 76137 2014-01-27 15 2250
次の出力を取得しようとしています。
Customer# Item Zip Avg Days/Ord Tot Ord Total Amt
--------- -------- ----- ---------- ------- ---------
ABC123 GHTH123 76137 15 2 2700
XYZ999 ZZZZZZZ 68106 60 2 550
XYZ999 YYYYYYY 68106 60 3 1250
私は sqldiff パッケージを使用してDATEDIFF
関数を使用しようとしていましたが、動作しないため、それでどこにもDATEDIFF
行きませんR
。
誰かがここでより良いアプローチを手伝ってくれますか?