2

さて、このSQLクエリをmap reduceに変換しようとしています

select
    o_orderpriority, 
    count(*) as order_count
from 
    orders
where 
    o_orderdate >= date '1993-07-01'
    and o_orderdate < date '1993-07-01' + interval '3' month
    and exists (
        select 
        *
        from 
        lineitem
        where 
        l_orderkey = o_orderkey
        and l_commitdate < l_receiptdate
    )
group by 
    o_orderpriority
order by 
    o_orderpriority;

次のマップ削減機能を試しました

    db.runCommand({
    mapreduce: "orders",
    query: {
        o_orderdate: {'$gte': new Date("July 01, 1993")},
        o_orderdate: {'$lt': new Date("Oct 01, 1993")}
    },
    map: function Map() {
            for(var i in this.o_lineitem) {
                if( this.o_lineitem[i].l_commitdate < this.o_lineitem[i].l_receiptdate) {
                    var o_orderpriority = this.o_lineitem[i].o_orderpriority;
                    emit( o_orderpriority, {count: 1} );
                }
            }
        },
    reduce: function(key, values) {
                var count= 0;
                for (var i = 0; i < values.length; i++) {
                    count+= values[i];
                }
                return count;
            },
    out: 'query004'
});

AI を実行すると、フォロー アラートが表示されます

Sat Aug 11 20:44:32 SyntaxError: missing ) after condition (shell):9

私には ) がありません、ありますか?

@Stenieが指摘した修正を行いましたが、今は次の問題があります

{
        "assertion" : "value too large to reduce",
        "assertionCode" : 13070,
        "errmsg" : "db assertion failure",
        "ok" : 0
}
4

1 に答える 1

3

問題は、エミットとリデュース関数が同じものを返さないことです。

マップ関数は次の値を発行します。

{count: 1}

つまり、reduce は同じ形式を返す必要があります。

reduce で単純な値を返しています。

return count;

エミットを変更して、JSON ドキュメントではなく 1 だけをエミットすることができます。その後、reduce を変更する必要はありません。それ以外の場合は、reduce を変更して、JSON ドキュメント {count: X} を返すようにします。ここで、X は計算されたカウントです。

参考までに、これが「値が大きすぎて減らすことができません」というエラーが発生する理由は、このように型を混在させると、「+」演算子が値を追加するのではなく連結を開始し、最終的に大きくなりすぎるためです。これをデバッグする方法を確認するには、 MapReduce のトラブルシューティングページをお勧めします。

于 2012-08-12T21:19:19.087 に答える