問題タブ [apache-drill]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4259 参照

cloudera - Cloudera Hadoop で Apache ドリルを使用できますか?

分散モードでApacheドリルをセットアップしようとしています。マスターと 2 つのスレーブを備えた Cloudera Hadoop クラスターが既にあります。apache drill で提供されているドキュメントから、典型的な cloudera クラスターでセットアップできるかどうかは明確ではありません。該当する記事が見つかりませんでした。あらゆる種類の助けをいただければ幸いです。

0 投票する
2 に答える
1611 参照

mysql - Apache Drill - HDFS と SQL のクエリ

Apache Drill を調べようとしています。私はデータ アナリストではなく、ただのインフラ サポート担当者です。Apache Drill に関するドキュメントが少なすぎるようです

Apache Drill で使用できるカスタム データ ストレージの詳細が必要です

  1. dfs と同じように Apache Drill を使用して、Hive なしで HDFS をクエリすることは可能ですか?
  2. MySQL や Microsoft SQL のような古い時代の RDBMS を照会することは可能ですか?

前もって感謝します

アップデート:

HDFS ストレージの防御でエラーが表示される (無効な JSON マッピング)

に置き換えれば、受け入れられそうですhdfs:///file:///

フォルダからすべてのライブラリファイルをコピーしました

<drill-path>/jars/3rdparty to <drill-path>/jars/

それを機能させることはできません。助けてください。私は開発者ではありません。インフラ担当です。

前もって感謝します

0 投票する
1 に答える
168 参照

sql - SQL を使用した Mongo への接続 - 関数構文

MongoDB で動作するように Microstrategy を構成しようとしています。Mstr が推奨する方法は、Simba ODBC ドライバーを使用することです。簡単な接続は問題なく動作します。関数を使用したいときに問題が発生します。たとえば、タイムスタンプから 1 時間だけ取得します。

私が試したもう 1 つのアプローチは、Apache ドリルを使用することで、まったく同じ問題に直面しています。

コードと名前は、オファーと呼ばれるコレクション内の一部のドキュメントの属性です。これはうまくいきます。

これは失敗します。私は別の構文postgresを試しました - date_part、to_date - Oracle、MySQLからの別のもの...、EXTRACTなど.

0 投票する
2 に答える
1604 参照

json - Apache Drill を使用して HBase でネストされた JSON データを取得する

Apache Drill を使用して、HBase テーブルで SQL クエリを実行しています。列の 1 つの値は次のとおりです。

idクエリを使用してフィールドにアクセスしたいと思います。何かのようなもの:

ご覧のとおり、これは機能しません。ファイル内の JSON データに対して同様のクエリが実行されます。私の質問は、HBase で JSON データをクエリできるかどうかです。

0 投票する
2 に答える
594 参照

apache - 分散モードの Apache Drill

SQL-on-semi 構造化データを実行するという要件のドリルを調査し始めました。Zookeeper を使用して 4 ノードのドリル クラスタをセットアップしました。それが実際にどのように機能するかについていくつか質問がありますが、

  1. dfs (ローカル ファイル システム) を使用して分散モードで Drill を実行すると、ノードの 1 つ (たとえば n1) に 1GB の Json ファイルがあります。任意のノード (n1、n2、n3、n4) から sqlline を起動してクエリを実行できます。n1 にのみ日付があります。私の質問は

    を。クエリはすべてのノードで実行されていますか? つまり、Drill はデータを他のノード n2、n3n4 に分散することによって、クエリの実行を並列化しますか?

    b. NO の場合、すべてのノード n2、n3、n4 に同じファイルをコピーすることで、Drill の MPP アーキテクチャを活用できますか?

0 投票する
2 に答える
1117 参照

amazon-redshift - Apache Drill は Amazon RedShift に接続できますか?

Apache Drill は Amazon RedShift に接続できますか? はいの場合、Amazon RedShift に接続するための Apache Drill の設定とプラグインを手伝ってくれる人はいますか。

0 投票する
3 に答える
10343 参照

hadoop - Apache Drill と Spark

私は Apache Spark と Spark-SQL の経験があります。最近、Apache Drill プロジェクトを見つけました。それらの最も重要な利点/違いは何ですか? 私はすでに Fast Hadoop Analytics (Cloudera Impala vs Spark/Shark vs Apache Drill)を読んだこと がありますが、このトピックはまだよくわかりません。