問題タブ [apache-drill]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

622 問題

0 投票する

1 に答える

291 参照

hive - ハイブとドリルはどのように統合されますか?

ドリルは、待ち時間の長い Hive とは対照的に、アドホックなドリルダウンクエリ用の興味深いツールのように見えます。
これら2つの間に適切な統合があるはずですが、見つけられませんでした。
今日、すべての作業が Hive/Shark で行われていると仮定しましょう。どうすればそれを Drill と統合できますか?
ドリルエンジンに切り替える必要はありますか?
Shark と Hive に似た統合を探しています。

2013-09-24T10:01:05.943

0 投票する

3 に答える

11945 参照

json - JSON オブジェクトのファイルを Parquet ファイルに変換する

動機: データを Apache Drill にロードしたい。Drill が JSON 入力を処理できることは理解していますが、それが Parquet データでどのように機能するかを確認したいと考えています。

最初にデータを Hive などにロードしてから、Parquet コネクタの 1 つを使用して出力ファイルを生成することなく、これを行う方法はありますか?

json apache parquet apache-drill

2014-02-11T00:54:11.537

0 投票する

1 に答える

672 参照

json - hbase に格納された json オブジェクトから複数の列をクエリする

1 つの列ファミリーに json データが格納されており、これにはいくつかの名前と値のペアがあります。さまざまな名前と値の組み合わせでこのデータをクエリしますが、これらのクエリは名前と値のペアに特に傾くことはありません (これにより、それらを列ファミリーに分割することが難しくなります)。

これらのクエリのパフォーマンスを向上させる最善の方法は何でしょうか? セカンダリインデックス、インパラ、フェニックスなどは役に立ちますか?
それらを複数の列ファミリーに分割すると役立つでしょうか? hbase が 2 つまたは 3 つの列ファミリーに最適に機能することを考慮すると、これが正しいことかどうかはわかりません。
ネストされたデータまたは json データを格納して優れたクエリパフォーマンスを達成するための優れたシステムは何でしょうか? Apacheドリルのようなものは役に立ちますか?

json hbase impala phoenix apache-drill

2014-07-14T21:10:50.233

0 投票する

1 に答える

498 参照

mongodb - これは Spark/Apache Drill の使用例ですか?

2種類のデータがあります-

1) スキーマレス (完全にスキーマレスというわけではありませんが、列は時間の経過とともに増加し続けており、スキーマが変更されたときにロード/パブリッシュジョブを変更したくありません)。このデータは現在、key-val storage に保存されています。キーの数は約1000です。ペアの数は約7億です。

2) RDBMS テーブル - それぞれ数百万行のテーブルのセット。

上記のすべてのデータの分析 (できれば SQL を使用) を可能にするデータストアを作成する必要があります。私はこの問題のいくつかの解決策を検討していましたが、Spark や Apache Drill などでこの問題を解決できると感じました。これは Spark-Shark の正しい使用例ですか? このユースケースで使用できる他のデータストア/ソリューションは何ですか? Cassandra? モンゴDB?

ありがとう。

mongodb apache-spark cassandra apache-drill bigdata

2014-09-18T06:29:22.727

0 投票する

1 に答える

166 参照

hadoop - すべての ANSI SQL 2003 クエリに対する Apache Drill サポート

Apache Drill のドキュメントで公開されているように、完全な ANSI SQL 2003 をサポートしています。私の質問は、HDFS/HIVE で行レベルのデータが更新または削除されたクエリを、Drill がどのように正確に実行できるかということです。HDFS のデータを変更できないことは周知のとおりです。もう 1 つお願いがあります。高度な認証情報が必要なため、「Apache Drill」のタグを作成してください。

hadoop hdfs bigdata apache-drill

2014-11-18T08:40:15.093

0 投票する

1 に答える

1766 参照

json - 圧縮された gz ファイルを Apache Drill でクエリする

圧縮されていない JSON ファイルを問題なくクエリする Apache Drill がありますが、gz 圧縮された JSON アーカイブに苦労しています。

私の理解では、Drill は gz ファイルを処理できると私が信じていた Hadoop ファイルコネクタを使用していますが、Drill の JSON クエリ機能は常に .json ファイルにロックされているようです。

私はこのようなことを試みました：

ただし、ファイルが見つからないというエラーが発生します。これも試しました：

「無効な JSON マッピング」エラーが発生します。

json hadoop gzip apache-drill

2014-12-14T07:25:22.377

0 投票する

1 に答える

484 参照

apache - Web ブラウザーで boot2docker を使用して、Docker で 8047 の Apache Drill WebUI にアクセスできないのはなぜですか?

CONTAINER_ID を調べると、返されるポート情報は null です。

ドリル Web UI にアクセスできませんが、cp などのデフォルトのストレージプラグインに対して sqlline は正常に動作しています。Web UI にアクセスできないため、新しいストレージプラグインを構成できません。

apache boot2docker webui apache-drill

2015-01-25T04:20:33.457

1 2 3 4 5 6 7 8 9 10

問題タブ [apache-drill]

Reference