一部のデータは最もクリーンではありません。たとえば、ある人が 2 つの異なる方法で住所を入力した場合、出力には 2 回表示される可能性があります。1 回目は「RD」で、2 回目は「Road」です。
おかしなことに、データの半分が一方のレコードに表示され、半分が他方のレコードに表示されます。そう...
Johnny, Larsen Rd, Tuesday, 4 milk bottles
Johnny, Larsen Road, Tuesday, 3 milk bottles
ジョニーの火曜日の消費量は、実際には牛乳 7 本でした。これら 2 つのオブジェクトをあまり苦労せずにマージする LINQ を作成しようとしていますが、これまでのところこれだけです。
var records = report.GroupBy(r => r.Date)
.Select(n => new MilkBottleRecord() {
Name = report.First().Name,
Address = report.First().Address,
Date = report.First().Date,
Bottles = n.Sum(x => x.Bottles),
});
助言がありますか?
A) これは私たちのデータではないので、実際にはクリーンアップを行うことはできません。B) SQL クエリからではなく、CSV 経由でデータを取得しています。
また、上記のクエリで関連する情報は日付のみです。これは、前のクエリで別のアカウントを既に分離しているためです。それは問題ないので、ここに含めるのに時間をかける価値があるとは思いませんでした.