問題タブ [impala]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3250 参照

hadoop - Tableau: Impala を使用して Cloudera Hadoop に接続中にエラーが発生しました

Tableau を使用して Cloudera Hadoop に接続する作業を行っています。サーバーとポートの詳細を提供し、「Impala」を使用して接続します。正常に接続し、デフォルトのスキーマを選択して、必要なテーブルを選択できます。

この後、ディメンションまたはメジャーを「グリッド」の行/列にドラッグ アンド ドロップすると、次のエラーが発生します。

[Cloudera][Hardy] (22) ThriftHiveClient からのエラー: クエリがゼロ以外のコードを返しました: 10025、原因: 失敗: SemanticException [エラー 10025]: 行 1:7 式が GROUP BY キー ' <column name>' にありません。

ただし、接続タイプを「HiveServer」(「Impala」ではない) として使用して同じことを試みると、正常に動作します。どこが間違っているのかわかりません。

これについて何か助けていただければ幸いです。

ありがとう。

よろしく、 スダカール

0 投票する
2 に答える
1101 参照

impala - Impala JDBC ドライバーでデフォルト以外のデータベースを指定する

私は Impala JDBC ドライバーを使用しています (または、実際には Hive Server 2 JDBC ドライバーだと思います)。別のデータベースに作成されたビューがあります。これを「store55」と呼びましょう。

私の見解が次のように定義されているとしましょう:

次のように JDBC を使用してこのビューをクエリしようとすると:

次のようなエラーが表示されます。

理想的には、データベース名を JDBC URL のどこかに指定するか、パラメーターとして指定したいのですが、この JDBC URL を使用しようとすると、同じエラーが発生します。

Hive2 JDBC ドライバーは、URL のデータベース部分を無視し、すべてのクエリがデフォルト データベースに対して実行されると想定しますか?

クエリを返すことができた唯一の方法は、ビュー定義自体を変更してデータベース名を含めることです。

ただし、ビュー定義にデータベース名を含めないようにしたいと思います。

ありがとう!

0 投票する
3 に答える
225 参照

mysql - Mysql - IMPALA クエリのヘルプが必要

Hive にテーブルが 1 つありますtable1。テーブルからデータを取得するためにimpalaを使用しています

テーブルの値はどこにありますか

ここで、すべてのデータをフェッチするように、table1 からデータをフェッチする必要がありますname (test1, test2, test3) but gives only top 2 records based on amount for each name

前もって感謝します

0 投票する
2 に答える
669 参照

hadoop - パーティショニングによる Impala でのデータのローカリティの制御

テーブルの作成時に理想的なデータの局所性またはレイアウトがわかっている場合に、Impala ノードがネットワークを介して他のノードから不必要にデータを要求することを避けたいと思います。これは、パーティションからのすべてのレコードがとにかく同じ場所 (ノード) で必要とされる「非加算」操作で役立ちます (パーセンタイルなど)。

パーティション内のすべてのデータを常に HDFS レプリカの単一ノードに配置するように Impala に指示することはできますか?

Impala-SQL では、「PARTITIONED BY」句がこの機能を提供するかどうかはわかりません。私の理解では、Impala はそのパーティションを HDFS 上の個別のファイルにチャンクしますが、HDFS はデフォルトで関連ファイルまたはブロックのコロケーションを保証しません (むしろ逆を達成しようとします)。

HDFS 開発に対する Impala の影響に関するいくつかの情報が見つかりましたが、これらが既に実装されているか、まだ計画中であるかは明確ではありません。

http://www.slideshare.net/deview/aaron-myers-hdfs-impala (スライド 23 ~ 24)

よろしくお願いします。

0 投票する
1 に答える
778 参照

impala - Imapala サーバーが起動しない

現在、 HADOOP 2.2.0 、 HIVE 0.12.0 、および Impala 1.2.3 を使用しています。imapala -server を起動しようとすると、起動しません。ログ ディレクトリを確認すると、次のエラーが表示されます。どんな助けでも大歓迎です。

0 投票する
1 に答える
1206 参照

hive - Hive テーブルのスキーマを変更する

HBase フィールドにマップされている Hive で作成されたテーブルを変更したいと考えています。最近、HBase にさらにいくつかの列を含めたので、これらのフィールドを Hive にも追加したいと考えています。

私が使用した作成のために:

今、hbaseにマップする必要があるハイブテーブルtest1にもう1列追加したいのですが、これを行う方法が見つかりません。助けてください ありがとう。

0 投票する
2 に答える
2591 参照

hadoop - impala外部テーブルでファイルヘッダーをスキップするには?

HDFS に 78 GB サイズのファイルがあります

その上に Impala 外部テーブルを作成して、利用可能なデータのグループ化と集計を実行する必要があります

問題 ファイルにヘッダーが含まれています。

質問 ファイルの読み取り中にファイルからヘッダーをスキップし、残りのデータに対してクエリを実行する方法はありますか。

ファイルをローカルにコピーして問題を解決する方法はありますが、ヘッダーを削除してから、更新されたファイルを HDFS に再度コピーしますが、ファイル サイズが大きすぎるため実行できません。

どなたか心当たりのある方教えてください...

任意の提案をいただければ幸いです....

前もって感謝します