pyhive ライブラリを使用して Python で presto クエリを実行しようとしていますが、最大再試行エラーが発生しています。ローカルのjupyterノートブック(ラップトップ)で実行しています。プレストノードに接続できないと思います。Azure hdinsight クラスターを使用しており、ヘッド ノードに presto アプリケーションをインストールしています (スターバースト ディストリビューションを使用)。クラスターのユーザー名とパスワードを使用し、ヘッド ノードの ssh ユーザーとパスワードも試しましたが、何も機能しません。以下は私のコードです:
from pyhive import presto
conn= presto.connect(
host='clustername-ssh.azurehdinsight.net',
port=8085,
username='sshuser'
password='sshpassword',
protocol='https'
).cursor()
conn.execute('SELECT * FROM hive.default.parquettest limit 1')
私が得ているエラーは次のとおりです。
ConnectionError: HTTPConnectionPool(host='sm-hdinsight01-ssh.azurehdinsight.net', port=8085): url: /v1/statement で最大再試行回数を超えました (原因 NewConnectionError(': Failed to Establish a new connection: [Errno 110 ] 接続がタイムアウトしました'、))
しかし、ヘッドノードのターミナルで実行すると動作します:
from pyhive import presto
conn= presto.connect(
host='localhost',
port=8085).cursor()
conn.execute('SELECT * FROM hive.default.parquettest limit 1')
私はここでいくつかの重要なことを見逃していると思います。助けてください。