問題タブ [hiveql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hive - 複数のサブクエリをハイブし、グループ化する
統計をMySQLからAmazonDynamoDBおよびElasticMapReduceに切り替えています。
MySQLで動作する次のクエリがあり、ハイブに同じテーブルがあり、MySQLと同じ結果が必要です(last_week、last_month、last_yearの製品ビュー)。
たとえば、先月ハイブを使用して結果を取得する方法を見つけました。
しかし、MySqlで得られるようなグループ化された結果が必要です。
ハイブでこれを行うことは可能ですか?
前もって感謝します、
アメル
hadoop - パラメーター化された LOCATION を使用した Hive CREATE EXTERNAL TABLE
これは期待どおりに機能します。
しかし、これはしません:
次のエラー (Hive 0.9.0) で失敗します。
失敗: 解析エラー: 行 9:11 で入力 'hdfs' が一致しませんでした。'''' の近くに EOF が必要です
私は何か間違ったことをしていますか、それとも既知の問題/制限ですか? 回避策の提案はありますか?
hive - HiveCASEステートメントのデータ型変換エラー
次のようなHiveQLクエリがあります。
これをHiveで実行すると、最近エラーが発生し始めましたFAILED: Error in semantic analysis: Line X:Y ArgumentTypeMismatch 'col_a': The expression after ELSE should have the same type as those after THEN: "int" is expected but "double" is found.
0
リテラルとの結果の間にデータ型の不一致があることは理解していますが(col_a / col_b)
、Hiveがこれを窒息させている理由、そしてさらに重要なことに、このエラーを解決するための最善の行動は明確ではありません。リテラル0
をとしてキャストする必要がありますか、double
それともより良いアプローチがありますか?
これは、AmazonEMRで実行されているHive0.8.1です。
hadoop - HDFS+Map Reduce を使用したアプリケーション例
[タグ:分散ファイル システム] などのトピックの紹介を含む、分散ソフトウェア システムのさまざまな側面をカバーするアカデミック コース「ミドルウェア」を持っています。これには、 hbase 、hadoop、mapreduce、hiveql、piglatinの紹介も含まれます。知りたいのですが、上記のテクノロジーを統合しようとする小さなプロジェクトを作成できますか。手始めに、Hadoopの感覚を持ち、 Eclipse を使って遊んでいるClouderaが提供するvmを知っています。イベントのストリームを入力として受け取り、これを分析して出力するアプリケーションを実装する方法を考えていました。
i7プロセッサと4Gb RAMを搭載したマシンにWindows / Linuxの両方があります。
すべてを開始する方法を教えてください。簡単なサンプル アプリケーションの提案は大歓迎です。
hive - 複数のパーティションのハイブを照会していますか?
Hive で同じテーブルの複数のパーティションを照会するにはどうすればよいですか? 同じコマンドで?
何かのようなもの ???
sql - Hive の一意の文字列数
Hive テーブルに文字列の列があり、この列の各文字列の出現回数をカウントしたいと考えています。どうやってやるの?
hive - HIVE での複数挿入の上書き
次のコマンドで、Hive で複数の挿入上書きを実行しようとしています。
そして、最初のコマンドの後の results_3 テーブルの内容
そして、2 番目のコマンドの後の results_3 テーブルの内容
しかし、私は2つのことを一緒にマージしたい. どうすればこれに対処できるか分かりますか?
ありがとう
hive - ハイブカウントタプル?
私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S
次のスキーマのテーブルがあります。res という名前の 1 つの列と、fileed という名前の partition_column の下にパーティション化された 3 つの列。
次に、このテーブルにデータをインポートしました
3 つのパーティション内の一意のチューブを数えようとしています。
たとえば、このコマンドは、データセット内の特定のタイトルの存在数をカウントします。
そしてそれは次のようなものを出力します
これをタプル (タイトル、アルバム、アーティスト) に拡張するにはどうすればよいですか? 次のような出力が必要な場合:
私のコード全体:
xmlデータの行は次のようになります
hive - 側面図はハイブで爆発します
文字列の配列の2つの列のexampleTableというテーブルがあります。
私の目標は、このようなテーブルを作成することです
私はLATERLVIEWを次のように使用することを考えました:
しかし、これは代わりにこれを生成します
どうすればこれに取り組むことができますか?前もって感謝します。
xpath - 属性を列として使用して XML データを Hive にインポートする方法
私はHiveQLにかなり慣れていないので、ちょっと行き詰まっています:S
xml 形式で保存されたデータがあり、列の Hive テーブル (文字列 Titles_2 、文字列 Artists_2、文字列 Albums_2) でこの xml ファイルからフィールドを抽出したいと考えています。
xml データのサンプル:
このデータは xmlout_2(line) というテーブルに格納されます。
これらの xpath コマンドを実行して HiveQL テーブル Stores を作成しましたが、各行の最初の曲しか追加されません。なぜそのように振る舞うのですか?
xpath_string の代わりに xpath を試すと、文字列ではなく文字列の配列が得られます。
その後、列を爆発させることを考えていますが、爆発は単一の列でしか使用できません。