問題タブ [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
thrift - 接続エラー:
Cloudera Manager 4.1.3 経由で Cloudera Impala v0.4 をインストールしました
私のクラスタはスレーブマシンのみで構成されています
したがって、これらのマシンで impala シェルを実行できます。
問題は、コマンドを実行すると(slave1/slave2で)
次のエラーが表示されます。
ここで impalad-host は、デフォルトでポート no で実行されるホスト名です21000
。
ホスト名とポート番号を設定するにはどうすればよいですか?
hadoop - Cloudera Impala で分割機能が機能しない
Cloudera Impala で分割機能を使用しようとすると、「分割が不明です」という AnalysisException が発生し続けます。組み込み関数のページに記載されている有効な関数のようです。参考までに、私は Hue を使用して Impala とやり取りしています。この問題の原因を知っている人はいますか?
hadoop - インパラはハイブと比較してより速いクエリ応答をどのように提供しますか
私は最近、Hive と Impala を使用して、HDFS にある大量の CSV データのセットを照会することを検討し始めました。予想通り、これまで使用してきたクエリでは、Hive と比較して Impala の方が応答時間が短縮されています。
まだHiveが必要で、Impalaが適していないクエリ/ユースケースのタイプがあるかどうか疑問に思っています.
HDFS 上の同じデータに対して、Impala はどのようにして Hive よりも高速なクエリ応答を提供しますか?
parameters - Cloudera Impala クエリの SQL パラメータ
Impala で実行されているクエリに関して簡単な質問があります (レポート ツールとして Pentaho レポート デザイナーを使用しています)。クエリは次のとおりです。
Pentaho レポート デザイナーで失敗します。その理由はパラメーターです。なぜなら、where 句を次のように変更すると、a.country = 'Denmark'
結果が返されるからです (正確に言うと、箇条書きが簡単なので、これを使用したいのです)。Pentaho がパラメータを で記述したいことは知っていますが${}
、Impala のパラメータの使用/不使用に関する情報は見つかりませんでした。情報、アイデア、何かありますか?
serialization - Apache Hive/Impala への JAXB オブジェクトのロード
メンバー変数として複数のプリミティブとコレクションを持つ複雑な Java (JAXB) オブジェクトを考えてみましょう。Reducer フェーズは、そのようなオブジェクトを < K, V > のペアとして HDFS に出力します。ここで、K は ID であり、V はオブジェクトのシリアル化された形式 (SequenceFileOutputFormat) です。
これらの Java シリアライズ オブジェクトを HDFS/ローカル ロケーションから Hive/Impala にロードすることは可能ですか?
MongoDB には、すぐに使用できる json ドキュメントとして JAXB オブジェクトを格納する機能があります。Hive または Impala で同じことを達成するための助けをいただければ幸いです。
hadoop - Cloudera Manager を使用しない Cloudera Impala のインストール
Cloudera Manager なしで ubuntu に imapala をインストールするためのリンクを提供してください。公式リンクでインストールできませんでした。
これらのクエリを使用してパッケージ impala を見つけることができません:
hadoop - 接続エラー:localhost:21000 に接続できませんでした
Clouderaマネージャーなしでローカルマシン(32ビットubuntu)にcloudera impalaをインストールしようとしています(32ビットubuntuではサポートされていません。私も試してみましたが失敗しました)。
次のコマンドを試して、リポジトリから impala をダウンロードしました。
ここまではうまくいきました。私の impala/conf/hive-site.xml は次のようになります
私の impala/conf/hdfs-site.xml は次のようになります。
今、私は impala-shell で localhost に接続しようとしていました。しかし、それは私にこのエラーを与えます
参考までに、私は hive-hadoop クラスターのメタストアに mysql を使用しています。
hadoop - Impala が com.mysql.jdbc.Driver を見つけられない
Red Hat 5 で疑似分散モードで CDH4 を使用して Cloudera Impala をセットアップしようとしています。MySQL メタストアに接続するために JDBC を使用する Hive を持っていますが、JDBC を使用して Impala をセットアップする際に問題があります。ここにある指示に従っています: http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_impala_jdbc.html
JAR をディレクトリに抽出し、そのディレクトリを に含めました$CLASSPATH
。にも含ま/usr/lib/hive/lib
れ$CLASSPATH
ていますmysql-connector-java-5.1.25-bin.jar
。
Hive ディレクトリと Impalaconf
ディレクトリの両方にhive-site.xml
、次のプロパティを含めています。
しかし、 を実行するsudo service impala-server restart
と、サーバー ログに次のエラーが記録されます。
それが言うのはこれによる原因です:
JDBC を使用して Impala を構成するために不足している手順はありますか?
hadoop - impalaデーモンのインスタンスとstatestoredデーモンのインスタンスが実行されているかどうかを確認するにはどうすればよいですか?
hadoop や hbase を起動したときのように。jps を使用して、namenode、tasktracker、または jobtracker が実行されているかどうかを確認できます。impalaデーモンが実行されているかどうかを確認できるコマンドはありますか?