問題タブ [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pentaho - Impala jdbc ドライバーは Pentaho Designer で動作します
Pentaho Designer で impala jdbc ドライバーを動作させるのに問題があります。
cloudera websiteから jdbc ドライバーを入手しました。ドライバーを抽出して lib/jdbc の下に配置した後、Generic Database 経由で接続をセットアップしました。
- カスタム接続 URL は次のとおりです: jdbc:hive2://example.com:21050/;auth=noSasl
- カスタム ドライバー クラス名は、org.apache.hive.jdbc.HiveDriver です。
「SELECT count(*) FROM table_1;」のような単純なクエリを試してみたところ、「ParentException: java.sql.SQLException: Method not supported」というエラーが発生しました。
何か案は?
cloudera - Impalaでクライアントによってクエリが起動されるとどうなりますか?
クエリが起動されたときに、クライアントはどのように impalad デーモンに連絡しますか? クライアントが impala によって実行されなければならないクエリを起動すると、バックグラウンドで正確に何が起こるのでしょうか?
cloudera - cloudera impala での複数クエリの実行
impala で同時に複数のクエリを実行することは可能ですか? はいの場合、impala はどのように処理しますか?
hadoop - 何を使用するか.. HDFS 上の Impala、Hbase 上の Impala、または Hbase のみ?
私は概念実証タスクに取り組んでいます。タスクは、Hadoop テクノロジを使用して製品の機能を実装することです。
機能は非常にシンプルです。「ネットワークの問題」に関する詳細を挿入できる UI があります。このような問題に関するすべての詳細が取得され、Oracle DB のテーブルに挿入されます。次に、このテーブルのデータを処理し、ヘルス スコアを計算します。
従来の Db の代わりに Hadoop を使用する必要があります。HDFS上のImpala? または Hbase の Impala ? またはHbase?
POC の実装に cloudera VM を使用しています。
私の理解によると、Hbase は NoSQL 分散データベースであり、実際には HDFS 上のレイヤーであり、データにアクセスするための Java API を提供します。Impala は、Hbase 経由または直接 HDFS 経由でデータにアクセスするための JDBC アクセスも提供するツールです。私はhadoopに非常に慣れていません。誰か助けてもらえますか?
cloudera - SQL Server データを Cloudera Manager に取得するための sqoop クエリ
sqoop import --connect 'jdbc:sqlserver://IP address;username=user;password=pswd;database=Master' --table [Person].[BusinessEntityContact] --target-dir /home/ubuntu/hdfs/dir動かない 。
参照: http://mapredit.blogspot.com/2011/10/sqoop-and-microsoft-sql-server.html [1]: http://i.stack.imgur.com/W5mBB.png
cloudera - Cloudera impala でパーティションを表示する方法はありますか?
通常、私はshow partitions <table>
ハイブで行うことができます。しかし、寄木細工のテーブルの場合、ハイブはそれを認識しません。hdfs に移動して dir 構造を確認できますが、それは理想的ではありません。それを行うより良い方法はありますか?
sql - 同じテーブルの別の行に一致するフィールドを持つすべての行を取得する
次のようなテーブルがあるとします。
そして、website='website.com' のすべての行を取得し、website='foo.com' の一致するユーザー ID を持つ対応する行を取得したい
したがって、この例では行 1 と 2 が返されます。
何か案は?
hadoop - パーティション化されたファイル構造からの Impala 外部テーブルの作成
次のような分割された fs 構造を提供します。
Impalaで外部テーブルを作成しようとしています:
Impala がサブディレクトリに再帰し、すべての csv ファイルをロードすることを望みます。しかし葉巻はありません。エラーはスローされませんが、データはテーブルにロードされません。
さまざまなグロブが好きである/logs/log_type/2013/08/*/*
か、/logs/log_type/2013/08/*/*/*
機能しませんでした。
これを行う方法はありますか?または、fsを再構築する必要がありますか?それに関するアドバイスはありますか?