私は、個人が特定の年に働いた企業に関する情報を含む雇用データを分析しています。各年は個別のデータ フレームです。
特定の年に複数の会社で働いていた個人と、1 年に複数の会社で働いていた個人をすばやく特定できるようにしたいと考えています。私の目標は、特定の企業が年内 (単一のデータ フレーム) および年をまたいで「退社」 (従業員が会社を変える) する回数の頻度を計算することです。
データ フレームは次のように構成されています。
year1 <- data.frame(individual=c("1", "2", "3", "4", "2", "6", "7", "3", "9", "10"),
firm=c("A", "B", "C", "D", "A", "C", "D", "B", "B", "C"))
year2 <- data.frame(individual=c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10"),
firm=c("A", "B", "D", "D", "A", "C", "D", "A", "B", "C"))
個人と企業の間の一意ではない関連性をすべて検索することにより、特定の年内にこれを行う方法はかなり確信していますが、複数のデータオブジェクト/年にわたってこれを行う方法について途方に暮れています。ここでも、特定の個人ではなく、企業の「退出」の頻度に関心があります。
私の理想的な出力は、次のように、各企業の全従業員の頻度/割合です。
exit(withinyear)_byfirm
exit(betweenyear)_byfirm