問題タブ [starburst]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database-connection - pyhiveを使用してPythonでprestoクエリを実行するには?
pyhive ライブラリを使用して Python で presto クエリを実行しようとしていますが、最大再試行エラーが発生しています。ローカルのjupyterノートブック(ラップトップ)で実行しています。プレストノードに接続できないと思います。Azure hdinsight クラスターを使用しており、ヘッド ノードに presto アプリケーションをインストールしています (スターバースト ディストリビューションを使用)。クラスターのユーザー名とパスワードを使用し、ヘッド ノードの ssh ユーザーとパスワードも試しましたが、何も機能しません。以下は私のコードです:
私が得ているエラーは次のとおりです。
ConnectionError: HTTPConnectionPool(host='sm-hdinsight01-ssh.azurehdinsight.net', port=8085): url: /v1/statement で最大再試行回数を超えました (原因 NewConnectionError(': Failed to Establish a new connection: [Errno 110 ] 接続がタイムアウトしました'、))
しかし、ヘッドノードのターミナルで実行すると動作します:
私はここでいくつかの重要なことを見逃していると思います。助けてください。
elasticsearch - presto elasticsearch で節ごとに pushdpown する方法
starburst-presto で SQL クエリを実行しています。関連するコネクタを使用してelasticsearchに接続されています。
SQL には「order by」句があります。この句はelasticsearchにプッシュダウンしていません。基本的に、elasticsearch のデータを特定のフィールドに基づいて並べ替え、結果を返したいと考えています。「order by」を使用したクエリは、プレストを使用すると時間がかかります。どうにかして最適なパフォーマンスを得ることができますか?
SQL:select e.employee_id from elasticsearch.es."employee:id:""2390571"" && (doj_timestamp:(>=15965454 && <=15972366)) sort=employee_id:desc" e offset 0 limit 5;
上記のクエリはランダムな結果を返しています。
誰でもここで助けてもらえますか?