最初の 2 つの手順は簡単です。
X = 1; Y = 3
db.collection.aggregate( [
{ $match: { Group: { $gte: X, $lt: Y } } },
{ $group: { _id: '$Group' } }
] );
上記のデータセットを使用すると、次のことが得られます。
{ "result" : [ { "_id" : 2 }, { "_id" : 1 } ], "ok" : 1 }
最大値を持つ K 個のドキュメントを選択できるようにするには、グループを変更して各ドキュメントとそのグループの最大値を含める必要があります。次に、グループと値 (DESC) でソートできるように巻き戻します。
db.collection.aggregate( [
{ $match: { Group: { $gte: X, $lt: Y } } },
{ $group: {
_id: '$Group',
docs: { $push: { _id: '$_id', Group: '$Group', Value: '$Value' } }
} },
{ $unwind: '$docs' },
{ $sort: { 'docs.Group': 1, 'docs.Value': -1 } }
] );
ただし、通常のクエリ演算子としての $push とは異なり、集約フレームワークで $push + $slice を実行することはまだできないため、これ以降は衝撃を受けます。私たちができる唯一のことは、アプリケーションがグループごとに最大値を持つ K 個のドキュメントを選択できるように別のグループを作成することです。
db.collection.aggregate( [
{ $match: { Group: { $gte: X, $lt: Y } } },
{ $group: {
_id: '$Group',
docs: { $push: { _id: '$_id', Group: '$Group', Value: '$Value' } }
} },
{ $unwind: '$docs' },
{ $sort: { 'docs.Group': 1, 'docs.Value': -1 } }
{ $group: {
_id: '$docs.Group',
docs: { $push: {
_id: '$docs._id',
Group: '$docs.Group',
Value: '$docs.Value'
} }
} }
] );
次に出力します(さらにいくつかのドキュメントを追加した後):
{
"result" : [
{
"_id" : 2,
"docs" : [
{
"_id" : ObjectId("51e3a73dea832e98dd545f68"),
"Group" : 2,
"Value" : 22
},
{
"_id" : ObjectId("51e3a738ea832e98dd545f66"),
"Group" : 2,
"Value" : 17
},
{
"_id" : ObjectId("51e3a73aea832e98dd545f67"),
"Group" : 2,
"Value" : 13
},
{
"_id" : ObjectId("51e3a2aaea832e98dd545f64"),
"Group" : 2,
"Value" : 8
},
{
"_id" : ObjectId("51e3a736ea832e98dd545f65"),
"Group" : 2,
"Value" : 7
}
]
},
{
"_id" : 1,
"docs" : [
{
"_id" : ObjectId("51e3a740ea832e98dd545f69"),
"Group" : 1,
"Value" : 21
},
{
"_id" : ObjectId("51e3a2a5ea832e98dd545f63"),
"Group" : 1,
"Value" : 10
},
{
"_id" : ObjectId("51e3a742ea832e98dd545f6a"),
"Group" : 1,
"Value" : 5
},
{
"_id" : ObjectId("51e3a2a3ea832e98dd545f62"),
"Group" : 1,
"Value" : 4
},
{
"_id" : ObjectId("51e3a745ea832e98dd545f6b"),
"Group" : 1,
"Value" : 2
}
]
}
],
"ok" : 1
}
MongoDB >= v3.2 の更新:
$project
グループごとの項目数を制限するために、集計パイプラインの最後にステージを追加できるようになりました。
$project: {
_id: '$_id',
docs: {
$slice: [
'$docs',
3 // max number of elements returned from the start of the array
]
}
}