次のようなデータがあります。
> head(ddd)
id affiliate_id affiliate_account_id source Pipeline num good bad
1 61046463 1006 69 29eada Contact Info Bad 1 FALSE TRUE
2 61046770 1006 69 344f39 Did not Reach 1 TRUE FALSE
3 61053937 1006 69 fff384 na 1 TRUE FALSE
4 61053941 1006 69 22d8b6 App Out 1 TRUE FALSE
5 61060137 1006 69 29eada No Offer 1 TRUE FALSE
6 61060221 1006 69 3fdb4f Contact Info Bad 1 FALSE TRUE
以下のようなものを取得できるように、ddply 関数を使用してデータを要約しようとしています。
affiliate_id affiliate_account_id lead_count good_count bad_count good_rate bad_rate
1 1006 69 360 300 60 % %
2 1006 5212 64 60 4 % %
3 1031 5102 22 3 20 % %
4 1035 5211 5 15 10 % %
5 1035 5216 90 30 60 % %
ここで、パーセンテージ (%) は、そのaffiliate_account_id の良い/悪いの比率です。
列の数を取得し、食品の良し悪しを評価する方法がわかりません。上の表の次の列から最後の 4 つの列に移動するのを手伝ってくれる人はいますか?
ddply(ddd, .(affiliate_id, affiliate_account_id), summarise, lead_count=length(affiliate_id))