問題タブ [hiveql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3011 参照

hive - 複数のサブクエリをハイブし、グループ化する

統計をMySQLからAmazonDynamoDBおよびElasticMapReduceに切り替えています。

MySQLで動作する次のクエリがあり、ハイブに同じテーブルがあり、MySQLと同じ結果が必要です(last_week、last_month、last_yearの製品ビュー)。

たとえば、先月ハイブを使用して結果を取得する方法を見つけました。

しかし、MySqlで得られるようなグループ化された結果が必要です。

ハイブでこれを行うことは可能ですか?

前もって感謝します、

アメル

0 投票する
2 に答える
7049 参照

hadoop - パラメーター化された LOCATION を使用した Hive CREATE EXTERNAL TABLE

これは期待どおりに機能します。

しかし、これはしません:

次のエラー (Hive 0.9.0) で失敗します。

失敗: 解析エラー: 行 9:11 で入力 'hdfs' が一致しませんでした。'''' の近くに EOF が必要です

私は何か間違ったことをしていますか、それとも既知の問題/制限ですか? 回避策の提案はありますか?

0 投票する
1 に答える
14971 参照

hive - HiveCASEステートメントのデータ型変換エラー

次のようなHiveQLクエリがあります。

これをHiveで実行すると、最近エラーが発生し始めましたFAILED: Error in semantic analysis: Line X:Y ArgumentTypeMismatch 'col_a': The expression after ELSE should have the same type as those after THEN: "int" is expected but "double" is found.

0リテラルとの結果の間にデータ型の不一致があることは理解していますが(col_a / col_b)、Hiveがこれを窒息させている理由、そしてさらに重要なことに、このエラーを解決するための最善の行動は明確ではありません。リテラル0をとしてキャストする必要がありますか、doubleそれともより良いアプローチがありますか?

これは、AmazonEMRで実行されているHive0.8.1です。

0 投票する
1 に答える
406 参照

hadoop - HDFS+Map Reduce を使用したアプリケーション例

[タグ:分散ファイル システム] などのトピックの紹介を含む、分散ソフトウェア システムのさまざまな側面をカバーするアカデミック コース「ミドルウェア」を持っています。これには、 hbase 、の紹介も含まれ。知りたいのですが、上記のテクノロジーを統合しようとする小さなプロジェクトを作成できますか。手始めに、の感覚を持ち、 Eclipse を使って遊んでいるが提供するを知っています。イベントのストリームを入力として受け取り、これを分析して出力するアプリケーションを実装する方法を考えていました。

プロセッサと4Gb RAMを搭載したマシンに / の両方があります。

すべてを開始する方法を教えてください。簡単なサンプル アプリケーションの提案は大歓迎です。

0 投票する
1 に答える
9336 参照

hive - 複数のパーティションのハイブを照会していますか?

Hive で同じテーブルの複数のパーティションを照会するにはどうすればよいですか? 同じコマンドで?

何かのようなもの ???

0 投票する
2 に答える
3673 参照

sql - Hive の一意の文字列数

Hive テーブルに文字列の列があり、この列の各文字列の出現回数をカウントしたいと考えています。どうやってやるの?

0 投票する
2 に答える
5232 参照

hive - HIVE での複数挿入の上書き

次のコマンドで、Hive で複数の挿入上書きを実行しようとしています。

そして、最初のコマンドの後の results_3 テーブルの内容

そして、2 番目のコマンドの後の results_3 テーブルの内容

しかし、私は2つのことを一緒にマージしたい. どうすればこれに対処できるか分かりますか?

ありがとう

0 投票する
1 に答える
3046 参照

hive - ハイブカウントタプル?

私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S

次のスキーマのテーブルがあります。res という名前の 1 つの列と、fileed という名前の partition_column の下にパーティション化された 3 つの列。

次に、このテーブルにデータをインポートしました

3 つのパーティション内の一意のチューブを数えようとしています。

たとえば、このコマンドは、データセット内の特定のタイトルの存在数をカウントします。

そしてそれは次のようなものを出力します

これをタプル (タイトル、アルバム、アーティスト) に拡張するにはどうすればよいですか? 次のような出力が必要な場合:

私のコード全体:

xmlデータの行は次のようになります

0 投票する
1 に答える
10116 参照

hive - 側面図はハイブで爆発します

文字列の配列の2つの列のexampleTableというテーブルがあります。

私の目標は、このようなテーブルを作成することです

私はLATERLVIEWを次のように使用することを考えました:

しかし、これは代わりにこれを生成します

どうすればこれに取り組むことができますか?前もって感謝します。

0 投票する
0 に答える
1049 参照

xpath - 属性を列として使用して XML データを Hive にインポートする方法

私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S

xml 形式で保存されたデータがあり、列の Hive テーブル (文字列 Titles_2 、文字列 Artists_2、文字列 Albums_2) でこの xml ファイルからフィールドを抽出したいと考えています。

xml データのサンプル:

このデータは xmlout_2(line) というテーブルに格納されます。

これらの xpath コマンドを実行して HiveQL テーブル Stores を作成しましたが、各行の最初の曲しか追加されません。なぜそのように振る舞うのですか?

xpath_string の代わりに xpath を試すと、文字列ではなく文字列の配列が得られます。

その後、列を爆発させることを考えていますが、爆発は単一の列でしか使用できません。