問題タブ [apache-drill]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
postgresql - apache drill 1.2 を使用して postgreSQL JDBC ドライバーを構成できない
Apache drill 1.2 では、RDBMS データをクエリできますhttps://drill.apache.org/blog/2015/10/16/drill-1.2-released/
ここで JDBC PostgreSQL ドライバーをダウンロードしました: https://jdbc.postgresql.org/download.html 私は JDBC4 を取りました。
jarファイルをこのフォルダー「apache-drill-1.2.0\jars\3rdparty」に入れました
そして今、postgres 用のプラグインを追加しようとしています。Web コンソール ( http://127.0.0.1:8047 ) を使用して実行しています。pgplugin という名前のプラグインを作成し、次の構成を追加しました。
{
"type": "jdbc",
"driver": "org.postgresql.Driver",
"url": "jdbc:postgresql://IP:port/myschema",
"username": "root",
"password": "root",
"enabled": true
}
エラーが表示されています:エラー(ストレージを作成/更新できません)
以下だけでも動作しません(同じエラー):
{
"type": "jdbc"
}
jar (jdbc postgres ドライバー) を構成ファイルのどこかにある apache ドリル クラスパスに追加する必要があることはわかっていますが、わかりません...
これを追加しようとしました:drill.exec.sys.store.provider.local.path = "/mypath"
drill-override.conf
->結果は次のとおりです。
drill.exec: {
cluster-id: "drillbits1",
zk.connect: "localhost:2181",
drill.exec.sys.store.provider.local.path = "/mypath"
}
しかし、それは機能していません...何かアイデアはありますか? どうもありがとう !
jdbc - Apache Drill 1.2 と Oracle JDBC
Apache Drill v1.2 および Oracle Database 10g Enterprise Edition リリース 10.2.0.4.0 - 64 ビットを組み込みモードで使用。
Apache Drill を Oracle DB に接続することに成功した人がいるかどうか知りたいです。次の構成で更新しましたdrill-override.conf
(ドキュメントごと):
に配置ojdbc6.jar
し\apache-drill-1.2.0\jars\3rdparty
ます。ストレージ プラグインを正常に作成できます。
しかし、次のようなクエリを発行すると:
次のエラーが表示されます。
他のスキーマ/テーブルをクエリして、同様の結果を得ようとしました。Teradata への接続も試みましたが、同じエラーが発生しました。提案がある/同様の問題に遭遇した人はいますか?
amazon-s3 - Apache Drill で S3 バケットにクエリを実行すると NullPointerException が発生する
次の方法でs3
バケットにクエリを実行しています。apache drill
同じことが通常の場合にも発生しますselect
:
select * from
directory/file.csvを使用すると同じことが起こります;
私が間違っていることは何ですか?
私のストレージプラグインファイルは次のとおりです。
明らかにaccessKeyId
とsecretAccessKey
変更されている場所...
red-queen
は mys3 bucket
で、バケット内はdirectory
フォルダとしてです。
apache-drill - Apacheドリルの複数のフラグメント
Apache ドリル クラスタでクエリを実行していますが、マイナー セグメントが 1 つしか作成されません。2 つのクエリの結合などのさまざまなクエリを試しましたが、500 万件のレコードで実行しましたが、まだ 1 つのフラグメントしか作成していません。複数のセグメントを作成して、各ドリル ビットで個別に実行できるようにするための構成変更はありますか。クエリが 1 つの drillbit インスタンスで実行されているか、複数のインスタンスで実行されているかを確認するにはどうすればよいですか?
apache - Apache Drill '組み込みドリルビットの起動に失敗しました'
VM をドリルして、正常に接続できました。停電後に vm を再起動しましたが、組み込みモードでドリルを開始しようとすると、次のメッセージが表示されます。
再起動する必要がある依存関係はありますか?
csv - Apache Drill で CSV 文字列を複数の列に変換する
使用: Apache ドリル
次のデータをより構造化された形式で取得しようとしています。
望ましい出力:
データセットは数 GB に達します。Drill は入力を 3 つの列に読み取り、最後の文字列を 1 つの列に読み込みます。最後の列で文字列操作操作 (REGEXP_REPLACE および CONCAT) を実行し、列を json (CONVERT_FROM) として読み取り、最後に KVGEN および FLATTEN を使用して異なる列に分離することで、目的の出力を正常に達成しました。
正規表現関数のため、実行時間はかなり長くなります。より良いアプローチはありますか?
(PS: 実行時間は、目的の出力を達成するために pyspark ジョブを使用する場合と比較されます)。
hadoop - Apache Drill - 遅いクエリ
Drill で次のストレージ プラグインをセットアップしています。
ただし、単純な
応答に 30 秒以上かかっています。何が不足していますか / どこからトラブルシューティングを開始すればよいですか?
Hive メタストア サーバーは現在、Drill と同じです。また、テーブル内のレコードは 20,000 未満です。