問題タブ [elasticsearch-aggregation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - ElasticSearch TopHits 集計サイズ
フィールドごとに集計を行うときは、topHits
subAggregation も行い、ES にすべての情報を返してもらいたいと考えTopHits
ています。しかし、 size を に指定するとInteger.MAX_VALUE
、何も返されません。なんで?
そして、 key の集約にバケットがありません"aggregation"
。
elasticsearch - ElasticSearch アグリゲーションは最小日付でヒットします
集計後に最小日付でヒットするにはどうすればよいですか? いくつかのフィールドで集計し、次にsubAggregation(AggregationBuilders.min("createdDate")
この日付で集計し、次にtopHits
subAggregation で集計します。しかし、この値では 1 ヒットではなく、3 ヒットが返されます。
elasticsearch - 一意の値の日付ヒストグラム
Elasticsearch 2.3 を使用しており、ユーザーが Web サイトにアクセスする Web ページごとに、ユーザー セッション ID と現在のタイムスタンプを含むレコードを生成します。
したがって、同じセッション ID でタイムスタンプが異なるレコードはほとんどありません。ユーザー レコードから一意のセッション ID
を作成しようとしています。date_histogram
一意性なしでヒストグラムを作成するのは簡単です。
しかし、そのような日付ヒストグラムを一意の値 (たとえば、一意の各セッション ID の最初の発生) で持つことは可能ですか?
elasticsearch - Elasticsearch 配列値カウント集計
サンプル文書:
期待される出力:
私のクエリ:
以下のクエリを使用して、「attribCount 」集計を取得できました。しかし、各属性値のカウントを取得する方法がわかりません。
attributes.value を使用して集計すると、全体のカウントが得られます。しかし、予想される出力に示されているように、名前の値の下にリストする必要があります。
regex - Elasticsearch: How can I filter & group by specific URL paths?
I've got an index, urls, which looks like this:
The path will store the PATH section from a url, e.g:
Would be stored as:
I'm storing all sorts of paths, so there could be more like:
I'm trying to find out the number of unique pageviews each of the paths have. I'm unsure how I should do this, should I use a regexp?
I'd imagine it'd look something like (pseudo code):
python - Python Elasticsearch ライブラリを使用してクエリ dict に aggs を追加する
Elasticsarch 用の Python の SDK に aggs クエリを追加しようとしています。Btu私はそれを機能させることができないようです。例えば
実行中
「aggs」キーなしで同じことを実行すると、正しく検証されます。Python ライブラリで使用するために、dict のようなクエリで集計を渡すにはどうすればよいですか?
elasticsearch - 多くのフィールド集約による弾性検索グループ
エラスティックサーチを使用した集計で次のグループを達成したくありません。同等の SQL は次のようになります (一種の):
集計はこのようなものでしょうか?
集計のことを正しく理解しているかどうかはわかりません。私は正しいですか?
ソリューションをシミュレートするテストを作成しました。バケット名とキー、またはメトリックと値ごとに list[dict(str, T)] の形式で集計を抽出します
テストはランダムに成功または失敗します。また、結果の時間も等しくありません (ただし、集計と新しいクエリの両方のクエリからわかるように、私が提供する日時は常に同じです)。
試験結果:
elasticsearch - Elasticsearch カーディナリティ集計で間違った結果が返される
両方の集計の PARTY_ID の数は同じである必要があります。ある場合は 3000 で、別の場合は等しくないすべての値 (2675 + 244 + 41 + 6 + 2 = 2950 ) の合計です。何が原因でしょうか?
結果 :