問題タブ [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - Hadoop 1.0.4 上の Impala
impala
Linuxボックスで作業しようとしています。私のはclouderaディストリビューションではありません。Hadoop
、Hive
、HBase
およびその他のコンポーネントを個別にインストールしました。
ここにバージョンがあります
私のものはredhat linuxボックスであるため、rpmを使用してimpalaをインストールしました。
自分のマシンで impala サーバーを構成できません (実際、site.xml を見つけることができません)。
私が行った調査では、 でimpala
のみ機能することがわかりましたHadoop 2.x
。本当ですか?2.x
それが正しければ、 に時間を無駄にするのではなく、に移行する必要があります1.x
。
誰かが同じことを確認できますか?前もって感謝します。
hadoop - ハイブまたはインパラにロードされたテーブルはありません
Centos 6.5 で CDH5 を使用しています。[クエリ エディター] > [Hive] または [Impala] を参照すると、左側のテーブル セクションに待機中のスピナーが表示されます。ハイブcliからクエリできるテーブルがあり、テーブルをロードすることはありません。誰かが私を正しい方向に向けることができますか?
sql - 「select」ステートメントの結果で省略された欠落行を埋める
select
ステートメントの結果で省略された行を埋める方法はありますか?
次のようなデータがあります。
...これは、次のような単純なクエリによって返されます。
結果が次のようになるように、不足している日数の行を追加したいです。
SQL経由でこれを行う方法はありますか?
hadoop - Impala の Load ステートメントを元に戻しますか?
Impala でテーブルを作成し、データをテーブルにロードしました。
HDFS からのデータが Impala データ ディレクトリに移動されました。HDFS でこのデータを見つけるにはどうすればよいですか??
sockets - Hadoop Impala 1.3.1 および Open Socket エラー
Impala を 1.2.4 -> 1.3.1 から、CDH を 4.6 -> 4.7 にアップグレードしたところ、書き込みの問題が発生し始めました (読み取りは問題ありません)。
テーブルを作成しようとすると、ソケットエラーが発生します:
テーブル test_5 を作成します (x int, y string); クエリ: create table test_5 (x int, y string) アプリケーション例外: 開いていないソケットで書き込みが呼び出されました
テーブルを更新しようとすると、同じことが起こります。
メタデータを無効にします。クエリ: メタデータを無効にするアプリケーション例外: 開いていないソケットで書き込みが呼び出されました
誰もがこの経験をしましたか?修正するには何を変更する必要がありますか?
ありがとう、ウラジミール
impala - ファイルをパーティション分割されたディレクトリに事前に分割せずに、Impala を使用して既存のテキスト ファイルを分割する方法はありますか?
日付フィールドを含む多くのレコードを含む単一のファイル「fruitsbought.csv」があるとします。
そのテキストファイルに基づいて「果物」テーブルを作成し、そのパーティションに一致するfruitsbought.txtのすべての行を含むパーティションを作成することにより、パフォーマンスを向上させるために「パーティション化」することは可能ですか?年と月、作成しますか?
または、別のプロセスの一部として、毎年のディレクトリを作成し、その年にフィルター処理された適切な「.csv」ファイルを HDFS のディレクトリ構造に配置してから、impala-shell でテーブルを作成する必要がありますか? ?
空のテーブルを作成し、パーティションを設定してから、そのレコードが入るパーティションをたまたま含む "Insert" ステートメントを使用できると聞きました。私の現在のケースでは、必要なすべてのレコードを含む単一の「fruitsbought.csv」が既にありますが、それをすぐにテーブルにする方法が気に入っています (ただし、parititionig はありません)。
1 つのファイルを適切なパーティションの下にソートされた複数のファイルに事前に分割するための別のプロセスを開発する必要がありますか? (1つのファイルは非常に大きいです)。
hadoop - CDH の更新後に impala を起動できない (5.0.0 -> 5.0.2)
cdh 5.0.2 にアップデートした後、impala (サーバー、状態ストア、カタログ) を起動できませんでした。私が見つけたところによると、起動スクリプトは実行可能ファイルが /usr/lib/impala/sbin にあることを期待しています。そのようなディレクトリはありませんでした。代わりに、/usr/lib/impala/sbin-debug と /usr/lib/impala/sbin-retail がありました。シンボリックリンクを作成することで、ようやくimpalaを開始できました
しかし、私はまだこの問題について困惑しています。impalaを開始する正しいフォームは何ですか. おそらく、「デバッグ」バージョンまたは「リテール」バージョンを実行するかどうかを選択できる、ある種の構成変数があるでしょう。