0

starburst-presto で SQL クエリを実行しています。関連するコネクタを使用してelasticsearchに接続されています。

SQL には「order by」句があります。この句はelasticsearchにプッシュダウンしていません。基本的に、elasticsearch のデータを特定のフィールドに基づいて並べ替え、結果を返したいと考えています。「order by」を使用したクエリは、プレストを使用すると時間がかかります。どうにかして最適なパフォーマンスを得ることができますか?

SQL:select e.employee_id from elasticsearch.es."employee:id:""2390571"" && (doj_timestamp:(>=15965454 && <=15972366)) sort=employee_id:desc" e offset 0 limit 5;

上記のクエリはランダムな結果を返しています。

誰でもここで助けてもらえますか?

4

1 に答える 1

3

クエリには ORDER BY と LIMIT の両方があるため、Presto ではそれを Top N クエリと呼びます。Presto は現在、トップ N プッシュダウンを提供していませんが、この機能は開発中です。

Elasticsearch コネクタの TopN プッシュダウンの問題を提出してください。とにかく実装しますが、ユーザーからの直接のフィードバックは、問題の優先順位を理解するのに役立ちます。

詳細については、 Presto community slack#pushdownのチャンネルをご覧ください。

于 2020-08-12T16:12:23.057 に答える