特定のフィールドのすべての値を照会することは可能ですか?「記事」があり、各記事に著者がいるとしましょう。すべての著者のリストを見つけるために実行できるクエリはありますか?
7 に答える
フィールドのすべての可能な値を取得するにはどうすればよい
author
ですか?
curl -XGET http://localhost:9200/articles/_search?pretty -d '
{
"aggs" : {
"whatever_you_like_here" : {
"terms" : { "field" : "author", "size":10000 }
}
},
"size" : 0
}'
ノート
"size":10000
最大10000の一意の値を取得します。デフォルトは10です。"size":0
デフォルトで"hits"
は、10個のドキュメントが含まれています。それらは必要ありません。デフォルトでは、バケットは
doc_count
降順で並べ替えられます。
参照:バケット用語の集約
また、このページによると、Elasticsearch 1.0では、ファセットのスーパーセットであるアグリゲーションにファセットが置き換えられていることに注意してください。
あなたが欲しいのはファセット検索だと思います。ドキュメントからこの例を見てください:
http://www.elasticsearch.org/guide/reference/api/search/facets/index.html
curl -X POST "http://localhost:9200/articles/_search?pretty=true" -d '
{
"query" : { "query_string" : {"query" : "*"} },
"facets" : {
"tags" : { "terms" : {"field" : "author"} }
}
}
'
あなたがあなたのために働くようにこれを調整することができるかどうか見てください。
これがお役に立てば幸い、マット
もう一つの例
リクエスト
curl -X POST "http://localhost:9200/_search?pretty=true" -d '
{
"facets" : {
"tags" : { "terms" : {"field" : "network.platform"} },
"size" : 60
},
"size" : 0
}
'
応答
{
"took" : 266,
"timed_out" : false,
"_shards" : {
"total" : 650,
"successful" : 650,
"failed" : 0
},
"hits" : {
"total" : 41,
"max_score" : 0.0,
"hits" : [ ]
},
"facets" : {
"tags" : {
"_type" : "terms",
"missing" : 15,
"total" : 26,
"other" : 0,
"terms" : [ {
"term" : "platform name 1",
"count" : 20
}, {
"term" : "platform name 2",
"count" : 6
} ]
}
}
}
Elasticsearchバージョンについては言及していませんが、ES 1.6の場合、推奨される方法は集計を使用することです。これが私が使っているものの例です。
--ネストされたクエリであるすべてのSTATUS値を取得します。
GET path for data/_search?size=200
{
"aggs": {
"something": {
"nested": {
"path": "NESTED_PATH"
},
"aggs": {
"somethingCodes": {
"terms": {
"field": "NESTED_PATH.STATUS",
"size": 50
}
}
}
}
}
}
および応答例:
"aggregations": {
"panels": {
"doc_count": 5029693,
"panelCodes": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "M",
"doc_count": 1943107
},
{
"key": "W",
"doc_count": 137904
},
{
"key": "E",
"doc_count": 69080
},
{
"key": "Y",
"doc_count": 4081
},
{
"key": "N",
"doc_count": 1063
},
{
"key": "T",
"doc_count": 483
},
{
"key": "",
"doc_count": 1
}
]
}
}
}
既存のフィールド値をチェックする最速の方法:
GET myindex/mytype/<id>/_termvectors?fields=Product.Material.Code
myindex
=インデックスmytype
=タイプ<id>
=ドキュメントID
最適な方法はelasticsearchアグリゲーション を使用することだと思いますhttps://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html
GET {index}/{type}/_search
{
"size": 0, <-- to not display search hits
"aggs": {
"{aggregation_name}": {
"terms": {
"field": "{filed_value}",
"size": 10
}
}
}
}
以下のコードを使用して、インデックス内のすべてのコンテンツから「記事」フィールド値のリストのみを取得してください。
curl'http :// localhost:9200 / my_index / _search?pretty = true&_source = articles '
それは確かにあなたを助けます。