2
POST /_search
{
"size": 0,
"aggs": {
    "by_grp" : {
        "terms": {
            "field": "grpId",
            "size": 0
        },
        "aggs": {
            "twitter_count": {
                "range": {
                    "field": "twitter.followers",
                    "ranges": [
                        { "to" : 501},
                        { "from" : 501, "to" : 1001},
                        { "from" : 1001, "to" : 5001},
                        { "from" : 5001}
                    ]
                },
                "aggs" : {
                    "email_addy": {
                        "terms" : {
                            "field": "email.value",
                            "size": 0
                        }
                    }
                }
            }
        }
    }
}
}

elastic-search-dsl を使用すると、私の python コードは

from datetime import datetime
from elasticsearch_dsl import DocType, String, Date, Integer, Search, Q
from elasticsearch_dsl.connections import connections
from elasticsearch import Elasticsearch

client = connections.create_connection(hosts=['http://somehost:9200'])
s = Search(using=client, index="dexy", doc_type="grp")

s.aggs.bucket('by_grp', 'terms', field='grpId', size=0) \
.bucket('twitter_count', 'range', field='twitter.followers')

CURL コードのように範囲を定義するには、ここからどこに行けばよいでしょうか? 現在、このトピックに関する GIT とドキュメントはまばらです。例が見つかりません。

4

1 に答える 1

5

インデント/行継続ルールに完全に従っていないように見えるため、これは奇妙に見えますが、これは機能します。

s.aggs.bucket('by_grp', 'terms', field='grpId', size=0) \
.bucket('twitter_count', 'range', field='twitter.followers',
    ranges=[
        {'to': 5001},
        {'from': 5001, 'to': 10001},
        {'from': 10001, 'to': 50001},
        {'from': 50001}
    ]
) \
.bucket('email_addy', 'terms', field='email.value', size=0)

注意として、サイズ = 0 は、クエリがデフォルトの 10 ではなく、そのアイテムのすべての結果を返す必要があることを意味します。レンジバケット。

于 2015-04-28T16:55:13.483 に答える