問題タブ [apache-drill]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
jdbc - jdbc の OBIEE sql ステートメントの生成
OBIEE は、ターゲット データベースに対して実行される SQL ステートメントをどのように生成しますか? Oracle データベースに対して実行すると 1 つの SQL ステートメントが生成され、Apache Drill に対して jdbc ドライバーを介して実行するとまったく異なる SQL ステートメントが生成されるというレポートがあります。私の問題は、2 番目のケースでは、クエリが構文的にも有効ではないことです。
私はこれを読みました - http://gerardnico.com/wiki/dat/obiee/query_compiler しかし、Oracleがドライバに基づいて実行される実際のクエリを決定するメカニズムをまだ理解していません。
apache-drill - Apache Drill の初心者: Web コンソールが表示されない
ubuntu 14.04 64 ボックスに apache-drill-1.2.0 をダウンロードしました。tar.zip の内容を抽出し、bin フォルダーに移動してドリルを実行しました。
を開こうとしましたhttp://localhost:8047
が、「サーバーへの接続を確立できません」というエラーが表示されます。
http.ssl_enabled: "TRUE" で https を有効にしようとしました。ただし、http/https を使用しても Web コンソールを開くことはできません。
関連するログを次に示します。
ディストリビューションに存在する Guava ライブラリ: guava-14.0.1 助けてください。
hadoop - Apache Drill - ファイルストレージプラグインで複数の区切り文字を使用していますか?
次のようなログがあります。
使用:
「」で区切られたストレージプラグインの場合、次の列が表示されます。
私が欲しいのは:
html - JSON ファイル内の文字列内に埋め込まれた HTML を Apache Drill でクエリするにはどうすればよいですか?
次のような JSON ファイルで Apache Drill を (初めて) 使用しようとしています。
私の最初のクエリは、drill: の hello world でSELECT * FROM DataFile.json
、列Key1
, Key2
,が返されましたKey3
。それらには 1 つの行しかなく、エントリが含まれていました:
"<htmltag attr1='bravo' /><htmltag attr2='delta' /><htmltag attr3='charlie' />"
[つまり、エントリのみKey1.htmltags
]。
2 つの質問があります。
- 各キーに 3 つの異なる値のエントリがあったのに、1 行しか返されなかったのはなぜですか?
- KVGEN/FLATTEN 関数を使用して上記の「htmltags」内の文字列を取得した後、HTML タグをさらに掘り下げる (分析してデータを抽出する) 方法はありますか?
apache-drill - ApacheドリルのCONVERT_FROM関数
ドリルを使用してHBaseを介してクエリを実行し、データをバイトからテキストに変換できます。
HBase テーブル「table1」のサンプル データ:
私が試したクエリ:
すべてのフィールドに CONVERT_FROM を使用するのはあまり良いことではありません。
すべてのフィールドでこの関数を使用する必要がないように、他の方法はありますか?
csv - Apache Drill を使用して CSV から Parquet テーブルを作成中にエラーが発生しました
100 万行を超える CSV 抽出 (Oracle データベース テーブルから生成) から Parquet テーブルを作成しようとしています。これらの行の約 25 には START_DATE の null 値があり、CTAS は""
として解釈できませんnull
。どんな提案でも大歓迎です。
mongodb - mongo コレクションに対する Apache ドリル クエリが「クラス com.mongodb.DBRef のコーデックが見つかりません」というエラーで失敗する
Mongo データベースからのコレクションに対するドリル クエリは、クエリに関係なく、コレクション アイテムに DBRef フィールドが存在する場合は常に失敗します。
phones
サンプルアイテムを含むコレクションの場合:
クエリ
結果は
コレクションに DBRef を持つアイテムが含まれていない場合、すべてが期待どおりに機能します。これを回避する方法を教えてください。
distributed - クエリにすべてのノードを使用するようにドリルを構成する方法 (複数のフラグメントを作成することにより)
2 つのノードでDrill (1.3)を使用しています。言う:
- 192.xxx.xxx.xxx
- 192.yyy.yyy.yyy
csvファイル(10億レコード)で(192.xxx.xxx.xxx から)クエリを実行してみました:
また、 &で結合クエリ(192.xxx.xxx.xxx から)を試しました:Hive
Oracle
(Drill UIから)取得するたびに:
他のノードが使用されない理由。次に、この場合に複数のノードを使用する利点は何ですか。
Drill はこれを自動的に処理しますか、それとも何か設定する必要がありますか?
誰かが複数のフラグメントを取得できる場合は、ユースケースを共有してください。
timestamp - TIMERANGE を含むドリル クエリ hbase
hbase シェルでは、次のようなコマンドを使用できます
get '/test/service','rk1',{COLUMN=>'fm1:col1',TIMERAGE=>[0,TS1]}
レコードのバージョンを照会するには、各バージョンのタイムスタンプ (「put」コマンドの実行時に設定した ts1) が[0,TS1)
どこにあるかを調べます。TS1
そのようなデータをクエリするためにドリルで同じ SQL クエリを実行する方法はありますか?
例えばselect * from hbase.`/test/table` as t where t.fm1.TIMESTAMP = 1442XXXXX