問題タブ [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - Tableau: Impala を使用して Cloudera Hadoop に接続中にエラーが発生しました
Tableau を使用して Cloudera Hadoop に接続する作業を行っています。サーバーとポートの詳細を提供し、「Impala」を使用して接続します。正常に接続し、デフォルトのスキーマを選択して、必要なテーブルを選択できます。
この後、ディメンションまたはメジャーを「グリッド」の行/列にドラッグ アンド ドロップすると、次のエラーが発生します。
[Cloudera][Hardy] (22) ThriftHiveClient からのエラー: クエリがゼロ以外のコードを返しました: 10025、原因: 失敗: SemanticException [エラー 10025]: 行 1:7 式が GROUP BY キー ' <column name>
' にありません。
ただし、接続タイプを「HiveServer」(「Impala」ではない) として使用して同じことを試みると、正常に動作します。どこが間違っているのかわかりません。
これについて何か助けていただければ幸いです。
ありがとう。
よろしく、 スダカール
impala - Impala JDBC ドライバーでデフォルト以外のデータベースを指定する
私は Impala JDBC ドライバーを使用しています (または、実際には Hive Server 2 JDBC ドライバーだと思います)。別のデータベースに作成されたビューがあります。これを「store55」と呼びましょう。
私の見解が次のように定義されているとしましょう:
次のように JDBC を使用してこのビューをクエリしようとすると:
次のようなエラーが表示されます。
理想的には、データベース名を JDBC URL のどこかに指定するか、パラメーターとして指定したいのですが、この JDBC URL を使用しようとすると、同じエラーが発生します。
Hive2 JDBC ドライバーは、URL のデータベース部分を無視し、すべてのクエリがデフォルト データベースに対して実行されると想定しますか?
クエリを返すことができた唯一の方法は、ビュー定義自体を変更してデータベース名を含めることです。
ただし、ビュー定義にデータベース名を含めないようにしたいと思います。
ありがとう!
mysql - Mysql - IMPALA クエリのヘルプが必要
Hive にテーブルが 1 つありますtable1
。テーブルからデータを取得するためにimpalaを使用しています
テーブルの値はどこにありますか
ここで、すべてのデータをフェッチするように、table1 からデータをフェッチする必要がありますname (test1, test2, test3)
but gives only top 2 records based on amount for each name
。
前もって感謝します
hadoop - パーティショニングによる Impala でのデータのローカリティの制御
テーブルの作成時に理想的なデータの局所性またはレイアウトがわかっている場合に、Impala ノードがネットワークを介して他のノードから不必要にデータを要求することを避けたいと思います。これは、パーティションからのすべてのレコードがとにかく同じ場所 (ノード) で必要とされる「非加算」操作で役立ちます (パーセンタイルなど)。
パーティション内のすべてのデータを常に HDFS レプリカの単一ノードに配置するように Impala に指示することはできますか?
Impala-SQL では、「PARTITIONED BY」句がこの機能を提供するかどうかはわかりません。私の理解では、Impala はそのパーティションを HDFS 上の個別のファイルにチャンクしますが、HDFS はデフォルトで関連ファイルまたはブロックのコロケーションを保証しません (むしろ逆を達成しようとします)。
HDFS 開発に対する Impala の影響に関するいくつかの情報が見つかりましたが、これらが既に実装されているか、まだ計画中であるかは明確ではありません。
http://www.slideshare.net/deview/aaron-myers-hdfs-impala (スライド 23 ~ 24)
よろしくお願いします。
impala - Imapala サーバーが起動しない
現在、 HADOOP 2.2.0 、 HIVE 0.12.0 、および Impala 1.2.3 を使用しています。imapala -server を起動しようとすると、起動しません。ログ ディレクトリを確認すると、次のエラーが表示されます。どんな助けでも大歓迎です。
hive - Hive テーブルのスキーマを変更する
HBase フィールドにマップされている Hive で作成されたテーブルを変更したいと考えています。最近、HBase にさらにいくつかの列を含めたので、これらのフィールドを Hive にも追加したいと考えています。
私が使用した作成のために:
今、hbaseにマップする必要があるハイブテーブルtest1にもう1列追加したいのですが、これを行う方法が見つかりません。助けてください ありがとう。
hadoop - impala外部テーブルでファイルヘッダーをスキップするには?
HDFS に 78 GB サイズのファイルがあります
その上に Impala 外部テーブルを作成して、利用可能なデータのグループ化と集計を実行する必要があります
問題 ファイルにヘッダーが含まれています。
質問 ファイルの読み取り中にファイルからヘッダーをスキップし、残りのデータに対してクエリを実行する方法はありますか。
ファイルをローカルにコピーして問題を解決する方法はありますが、ヘッダーを削除してから、更新されたファイルを HDFS に再度コピーしますが、ファイル サイズが大きすぎるため実行できません。
どなたか心当たりのある方教えてください...
任意の提案をいただければ幸いです....
前もって感謝します