database-connection - pyhiveを使用してPythonでprestoクエリを実行するには?

Question

pyhive ライブラリを使用して Python で presto クエリを実行しようとしていますが、最大再試行エラーが発生しています。ローカルのjupyterノートブック(ラップトップ)で実行しています。プレストノードに接続できないと思います。Azure hdinsight クラスターを使用しており、ヘッドノードに presto アプリケーションをインストールしています (スターバーストディストリビューションを使用)。クラスターのユーザー名とパスワードを使用し、ヘッドノードの ssh ユーザーとパスワードも試しましたが、何も機能しません。以下は私のコードです：

from pyhive import presto
conn= presto.connect(
    host='clustername-ssh.azurehdinsight.net',
    port=8085,
    username='sshuser'
    password='sshpassword',
    protocol='https'
    ).cursor()
conn.execute('SELECT * FROM hive.default.parquettest limit 1')

私が得ているエラーは次のとおりです。

ConnectionError: HTTPConnectionPool(host='sm-hdinsight01-ssh.azurehdinsight.net', port=8085): url: /v1/statement で最大再試行回数を超えました (原因 NewConnectionError(': Failed to Establish a new connection: [Errno 110 ] 接続がタイムアウトしました'、））

しかし、ヘッドノードのターミナルで実行すると動作します:

from pyhive import presto
conn= presto.connect(
    host='localhost',
    port=8085).cursor()
conn.execute('SELECT * FROM hive.default.parquettest limit 1')

私はここでいくつかの重要なことを見逃していると思います。助けてください。

database-connection - pyhiveを使用してPythonでprestoクエリを実行するには?

1 に答える 1

Related

Reference