特定の日付に複数のレコードがある場合、その日の最新のレコードを除くすべてを削除したいと思います。たとえば、以下の表では、IDが9、10、12のレコードは同じ日付です。したがって、ID 12のレコードの日付が最新であるため、9と10を削除する必要があります。
id date
1 2012-04-25 00:00:00.000000
2 2012-04-26 00:00:00.000000
3 2012-04-23 00:00:00.000000
4 2012-04-24 00:00:00.000000
5 2012-05-01 00:00:00.000000
6 2012-05-02 00:00:00.000000
7 2012-05-03 00:00:00.000000
8 2012-05-04 00:00:00.000000
9 2012-04-30 00:30:00.000000
10 2012-04-30 18:00:00.000000
11 2012-04-29 00:00:00.000000
12 2012-04-30 18:40:00.000000
13 2012-05-05 00:00:00.000000
14 2012-05-05 09:31:31.000000
重複を削除するための(ダーティ)rakeタスクは次のとおりです
task :remove_duplicate do
Rake::Task["remove_duplicate"].invoke
end
task :remove_duplicate => :environment do
weights = Weight.count(:group => "DATE(date)", :having => "COUNT(id) > 1")
weights_to_delete = []
weights.each do |weight|
start_date = weight[0].to_date.beginning_of_day
end_date = weight[0].to_date.end_of_day
day_weights = Weight.where("date >= ? and date <= ?", start_date, end_date).order(:date)
day_weights[0..-2].each do |weight|
weights_to_delete.push weight.id
end
end
Weight.delete(weights_to_delete)
end
説明したようにレコードを削除することはできますが、私が取っているアプローチには満足していません。ActiveRecord APIをより良い方法でのみ利用して、特定の日付に重複するレコードを削除し、最新のレコードを保持するように案内してください。
ありがとう、アミット・パテル