14

MongoDB の出力フォーマットの集計関数はどの程度柔軟ですか?

データ形式:

{
        "_id" : ObjectId("506ddd1900a47d802702a904"),
        "port_name" : "CL1-A",
        "metric" : "772.0",
        "port_number" : "0",
        "datetime" : ISODate("2012-10-03T14:03:00Z"),
        "array_serial" : "12345"
}

現在、この集計関数を使用して、DateTime の配列、メトリックの配列、およびカウントを返しています。

{$match : { 'array_serial' : array, 
                            'port_name' : { $in : ports},
                            'datetime' : { $gte : from, $lte : to}
                        }
                },
               {$project : { port_name : 1, metric : 1, datetime: 1}},
               {$group : { _id : "$port_name", 
                            datetime : { $push : "$datetime"},
                            metric : { $push : "$metric"},
                            count : { $sum : 1}}}

これは素晴らしく、非常に高速ですが、日時/メトリックごとに1つの配列になるように出力をフォーマットする方法はありますか? このような:

[
    {
      "_id" : "portname",
      "data" : [
                ["2012-10-01T00:00:00.000Z", 1421.01],
                ["2012-10-01T00:01:00.000Z", 1361.01],
                ["2012-10-01T00:02:00.000Z", 1221.01]
               ]
    }
]

これは、チャートコードが期待するフォーマットであるため、フロントエンドを大幅に簡素化します。

4

3 に答える 3

16

Aggregation Framework を使用して 2 つのフィールドを値の配列に結合することは可能ですが、(少なくとも MongoDB 2.2.0 では) それほど簡単ではありません。

次に例を示します。

db.metrics.aggregate(

    // Find matching documents first (can take advantage of index)
    { $match : {
        'array_serial' : array, 
        'port_name' : { $in : ports},
        'datetime' : { $gte : from, $lte : to}
    }},

    // Project desired fields and add an extra $index for # of array elements
    { $project: {
        port_name: 1,
        datetime: 1,
        metric: 1,
        index: { $const:[0,1] }
    }},

    // Split into document stream based on $index
    { $unwind: '$index' },

    // Re-group data using conditional to create array [$datetime, $metric]
    { $group: {
        _id: { id: '$_id', port_name: '$port_name' },
        data: {
            $push: { $cond:[ {$eq:['$index', 0]}, '$datetime', '$metric'] }
        },
    }},

    // Sort results
    { $sort: { _id:1 } },

    // Final group by port_name with data array and count
    { $group: {
        _id: '$_id.port_name',
        data: { $push: '$data' },
        count: { $sum: 1 }
    }}
)
于 2012-10-09T03:51:47.637 に答える
2

MongoDB 2.6 では を導入$mapすることで、これがはるかに簡単になりました。これにより、より単純な形式の配列転置が可能になります。

db.metrics.aggregate([
   { "$match": {
       "array_serial": array, 
       "port_name": { "$in": ports},
       "datetime": { "$gte": from, "$lte": to }
    }},
    { "$group": {
        "_id": "$port_name",
        "data": {
            "$push": {
                "$map": {
                    "input": [0,1],
                    "as": "index",
                    "in": {
                        "$cond": [
                            { "$eq": [ "$$index", 0 ] },
                            "$datetime",
                            "$metric"
                        ]
                    }
                }
            }
        },
        "count": { "$sum": 1 }
    }}
])

のアプローチとよく似てい$unwindますが、2 つの値で構成されるマップ操作に「入力」として配列を指定し、基本的にこれらの値を操作を介して必要なフィールド値に置き換えます$cond

これにより、以前のリリースで必要だったドキュメントの変換に必要なすべてのパイプラインのジャグリングが実際に削除され、実際の集計は手元のジョブに任せられます。これは基本的に「port_name」値ごとに蓄積され、配列への変換はもはや問題ではありません。範囲。

于 2015-11-01T06:21:45.190 に答える
1

$push と $addToSet を使用せずに集約フレームワークで配列を構築することは、欠けているように思われるものです。私はこれを以前に機能させようとしましたが、失敗しました。次のことができれば最高です。

data : {$push: [$datetime, $metric]}

$group、しかしそれはうまくいきません。

また、次のような「リテラル」オブジェクトの構築は機能しません。

data : {$push: {literal:[$datetime, $metric]}}
or even data : {$push: {literal:$datetime}}

彼らが最終的に、この種のデータを操作するためのより良い方法を考え出すことを願っています.

于 2012-10-08T19:54:59.007 に答える