“hiveql”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

3011 参照

hive - 複数のサブクエリをハイブし、グループ化する

統計をMySQLからAmazonDynamoDBおよびElasticMapReduceに切り替えています。

MySQLで動作する次のクエリがあり、ハイブに同じテーブルがあり、MySQLと同じ結果が必要です（last_week、last_month、last_yearの製品ビュー）。

たとえば、先月ハイブを使用して結果を取得する方法を見つけました。

しかし、MySqlで得られるようなグループ化された結果が必要です。

ハイブでこれを行うことは可能ですか？

前もって感謝します、

アメル

2013-03-04T12:09:10.393

0 投票する

2 に答える

7049 参照

hadoop - パラメーター化された LOCATION を使用した Hive CREATE EXTERNAL TABLE

これは期待どおりに機能します。

しかし、これはしません:

次のエラー (Hive 0.9.0) で失敗します。

失敗: 解析エラー: 行 9:11 で入力 'hdfs' が一致しませんでした。'''' の近くに EOF が必要です

私は何か間違ったことをしていますか、それとも既知の問題/制限ですか? 回避策の提案はありますか?

hadoop hive hiveql

2013-03-13T10:13:11.643

0 投票する

1 に答える

14971 参照

hive - HiveCASEステートメントのデータ型変換エラー

次のようなHiveQLクエリがあります。

これをHiveで実行すると、最近エラーが発生し始めましたFAILED: Error in semantic analysis: Line X:Y ArgumentTypeMismatch 'col_a': The expression after ELSE should have the same type as those after THEN: "int" is expected but "double" is found.

0リテラルとの結果の間にデータ型の不一致があることは理解していますが(col_a / col_b)、Hiveがこれを窒息させている理由、そしてさらに重要なことに、このエラーを解決するための最善の行動は明確ではありません。リテラル0をとしてキャストする必要がありますか、doubleそれともより良いアプローチがありますか？

これは、AmazonEMRで実行されているHive0.8.1です。

hive hiveql

2013-03-18T19:29:47.523

0 投票する

1 に答える

406 参照

hadoop - HDFS+Map Reduce を使用したアプリケーション例

[タグ:分散ファイルシステム] などのトピックの紹介を含む、分散ソフトウェアシステムのさまざまな側面をカバーするアカデミックコース「ミドルウェア」を持っています。これには、 hbase 、hadoop、mapreduce、hiveql、piglatinの紹介も含まれます。知りたいのですが、上記のテクノロジーを統合しようとする小さなプロジェクトを作成できますか。手始めに、Hadoopの感覚を持ち、 Eclipse を使って遊んでいるClouderaが提供するvmを知っています。イベントのストリームを入力として受け取り、これを分析して出力するアプリケーションを実装する方法を考えていました。

i7プロセッサと4Gb RAMを搭載したマシンにWindows / Linuxの両方があります。

すべてを開始する方法を教えてください。簡単なサンプルアプリケーションの提案は大歓迎です。

hadoop mapreduce hbase hdfs hiveql

2013-03-19T13:32:34.600

0 投票する

1 に答える

9336 参照

hive - 複数のパーティションのハイブを照会していますか?

Hive で同じテーブルの複数のパーティションを照会するにはどうすればよいですか? 同じコマンドで？

何かのようなもの？？？

hive hiveql

2013-03-20T15:41:38.043

0 投票する

2 に答える

3673 参照

sql - Hive の一意の文字列数

Hive テーブルに文字列の列があり、この列の各文字列の出現回数をカウントしたいと考えています。どうやってやるの？

sql hive hiveql

2013-03-20T16:11:03.300

0 投票する

2 に答える

5232 参照

hive - HIVE での複数挿入の上書き

次のコマンドで、Hive で複数の挿入上書きを実行しようとしています。

そして、最初のコマンドの後の results_3 テーブルの内容

そして、2 番目のコマンドの後の results_3 テーブルの内容

しかし、私は2つのことを一緒にマージしたい. どうすればこれに対処できるか分かりますか?

ありがとう

hive hiveql

2013-03-20T23:01:29.343

0 投票する

1 に答える

3046 参照

hive - ハイブカウントタプル？

私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S

次のスキーマのテーブルがあります。res という名前の 1 つの列と、fileed という名前の partition_column の下にパーティション化された 3 つの列。

次に、このテーブルにデータをインポートしました

3 つのパーティション内の一意のチューブを数えようとしています。

たとえば、このコマンドは、データセット内の特定のタイトルの存在数をカウントします。

そしてそれは次のようなものを出力します

これをタプル (タイトル、アルバム、アーティスト) に拡張するにはどうすればよいですか? 次のような出力が必要な場合:

私のコード全体:

xmlデータの行は次のようになります

hive hiveql

2013-03-21T19:42:31.463

0 投票する

1 に答える

10116 参照

hive - 側面図はハイブで爆発します

文字列の配列の2つの列のexampleTableというテーブルがあります。

私の目標は、このようなテーブルを作成することです

私はLATERLVIEWを次のように使用することを考えました：

しかし、これは代わりにこれを生成します

どうすればこれに取り組むことができますか？前もって感謝します。

hive hiveql

2013-03-22T01:28:59.577

0 投票する

0 に答える

1049 参照

xpath - 属性を列として使用して XML データを Hive にインポートする方法

私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S

xml 形式で保存されたデータがあり、列の Hive テーブル (文字列 Titles_2 、文字列 Artists_2、文字列 Albums_2) でこの xml ファイルからフィールドを抽出したいと考えています。

xml データのサンプル:

このデータは xmlout_2(line) というテーブルに格納されます。

これらの xpath コマンドを実行して HiveQL テーブル Stores を作成しましたが、各行の最初の曲しか追加されません。なぜそのように振る舞うのですか？

xpath_string の代わりに xpath を試すと、文字列ではなく文字列の配列が得られます。

その後、列を爆発させることを考えていますが、爆発は単一の列でしか使用できません。

xpath hive hiveql

2013-03-22T20:05:46.333

問題タブ [hiveql]

Reference