問題タブ [apache-drill]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cloudera - Cloudera Hadoop で Apache ドリルを使用できますか?
分散モードでApacheドリルをセットアップしようとしています。マスターと 2 つのスレーブを備えた Cloudera Hadoop クラスターが既にあります。apache drill で提供されているドキュメントから、典型的な cloudera クラスターでセットアップできるかどうかは明確ではありません。該当する記事が見つかりませんでした。あらゆる種類の助けをいただければ幸いです。
mysql - Apache Drill - HDFS と SQL のクエリ
Apache Drill を調べようとしています。私はデータ アナリストではなく、ただのインフラ サポート担当者です。Apache Drill に関するドキュメントが少なすぎるようです
Apache Drill で使用できるカスタム データ ストレージの詳細が必要です
- dfs と同じように Apache Drill を使用して、Hive なしで HDFS をクエリすることは可能ですか?
- MySQL や Microsoft SQL のような古い時代の RDBMS を照会することは可能ですか?
前もって感謝します
アップデート:
HDFS ストレージの防御でエラーが表示される (無効な JSON マッピング)
に置き換えれば、受け入れられそうですhdfs:///
。file:///
フォルダからすべてのライブラリファイルをコピーしました
<drill-path>/jars/3rdparty to <drill-path>/jars/
それを機能させることはできません。助けてください。私は開発者ではありません。インフラ担当です。
前もって感謝します
sql - SQL を使用した Mongo への接続 - 関数構文
MongoDB で動作するように Microstrategy を構成しようとしています。Mstr が推奨する方法は、Simba ODBC ドライバーを使用することです。簡単な接続は問題なく動作します。関数を使用したいときに問題が発生します。たとえば、タイムスタンプから 1 時間だけ取得します。
私が試したもう 1 つのアプローチは、Apache ドリルを使用することで、まったく同じ問題に直面しています。
コードと名前は、オファーと呼ばれるコレクション内の一部のドキュメントの属性です。これはうまくいきます。
これは失敗します。私は別の構文postgresを試しました - date_part、to_date - Oracle、MySQLからの別のもの...、EXTRACTなど.
json - Apache Drill を使用して HBase でネストされた JSON データを取得する
Apache Drill を使用して、HBase テーブルで SQL クエリを実行しています。列の 1 つの値は次のとおりです。
id
クエリを使用してフィールドにアクセスしたいと思います。何かのようなもの:
ご覧のとおり、これは機能しません。ファイル内の JSON データに対して同様のクエリが実行されます。私の質問は、HBase で JSON データをクエリできるかどうかです。
apache - 分散モードの Apache Drill
SQL-on-semi 構造化データを実行するという要件のドリルを調査し始めました。Zookeeper を使用して 4 ノードのドリル クラスタをセットアップしました。それが実際にどのように機能するかについていくつか質問がありますが、
dfs (ローカル ファイル システム) を使用して分散モードで Drill を実行すると、ノードの 1 つ (たとえば n1) に 1GB の Json ファイルがあります。任意のノード (n1、n2、n3、n4) から sqlline を起動してクエリを実行できます。n1 にのみ日付があります。私の質問は
を。クエリはすべてのノードで実行されていますか? つまり、Drill はデータを他のノード n2、n3n4 に分散することによって、クエリの実行を並列化しますか?
b. NO の場合、すべてのノード n2、n3、n4 に同じファイルをコピーすることで、Drill の MPP アーキテクチャを活用できますか?
amazon-redshift - Apache Drill は Amazon RedShift に接続できますか?
Apache Drill は Amazon RedShift に接続できますか? はいの場合、Amazon RedShift に接続するための Apache Drill の設定とプラグインを手伝ってくれる人はいますか。
hadoop - Apache Drill と Spark
私は Apache Spark と Spark-SQL の経験があります。最近、Apache Drill プロジェクトを見つけました。それらの最も重要な利点/違いは何ですか? 私はすでに Fast Hadoop Analytics (Cloudera Impala vs Spark/Shark vs Apache Drill)を読んだこと がありますが、このトピックはまだよくわかりません。