私はアメリカのすべての交通システムのデータベースを使用しており、さまざまな機関を比較しようとしています。それぞれのケースは、組織の特定の部分です。たとえば、バス路線は地下鉄とは別です。特定の機関のすべてのケースの値を組み合わせたいと思います。
基本的に、各「Trs_Id」の各列の値を合計し、残りを削除したいと思います。このデータフレームは、営業費用(「opex」)の内訳です。これが私のデータセットがRでどのように見えるかです:
> colnames(opex)
[1] "Trs_Id" "Mode_Cd"
[3] "Service_Cd" "Expense_Category_Desc"
[5] "Op_Sal_Wage_Amt" "Other_Sal_Wage_Amt"
[7] "Fringe_Benefit_Amt" "Service_Costs_Amt"
[9] "Fuel_Lubricant_Amt" "Tire_Tube_Amt"
[11] "Other_Mat_Sup_Amt" "Utility_Amt"
[13] "Casuality_Liability_Amt" "Tax_Amt"
[15] "In_Report_Amt" "Sep_Report_Amt"
[17] "Misc_Expense_Amt" "Expense_Transfer_Amt"
[19] "Ada_Related_Amt"
> NROW(opex)
[1] 6956
> id_nm <- table(opex$Trs_Id)
> NROW(id_nm)
[1] 616