問題タブ [hiveql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
41293 参照

hadoop - Hive はサポートしていませんが、存在します。次のクエリはどのように記述すればよいですか?

列 ID を持つ 2 つのテーブル A と B があります。Bに存在しないIDをAから取得したい.明白な方法は次のとおりです。

残念ながら、Hive は in、exists、subqueries をサポートしていません。結合を使用して上記を達成する方法はありますか?

私は次のことを考えました

しかし、A のどの ID とも等しくない ID が B に常に存在するため、これは A の全体を返すようです。

0 投票する
1 に答える
10573 参照

hadoop - if-else のブロック ステートメント

Hive は条件文をサポートしています - https://cwiki.apache.org/Hive/languagemanual-udf.html#LanguageManualUDF-ConditionalFunctions

ただし、ブロック条件ステートメントを使用したいと考えています。たとえば、似たような列を持つ 2 つのテーブル A と B があります (ただし、列名は同じではありません)。B が優先されるように、A と B から新しいテーブルを作成したいと考えています。したがって、行が B に存在する場合は B から選択し、そうでない場合は A から行を選択します。

上記のクエリは機能しません。Hive がブロック条件ステートメントをサポートしていないためですか? 上記の機能を実装するにはどうすればよいですか?

0 投票する
1 に答える
9157 参照

hive - この行の配列でハイブ行をグループ化する

次のようなテーブルがあります。

そして、次のような新しいテーブルで、ユーザーのすべてのエイリアスを配列にグループ化したいと思います。

HiveQL でそれを行う方法がわかりません。そのために UDF を作成する必要がありますか?

ありがとう !

0 投票する
1 に答える
498 参照

hive - Tableau からの接続時に、Hive で作成されたデータベースを表示できません。

Hive にサンプル データベースを作成し、その中にいくつかのサンプル テーブルを作成しました。BI ツール 'Tableau' から Hive に接続しているときに、作成されたデータベースを表示できません。既定のデータベースのみが表示されます。Tableau で新しく作成されたデータベースにアクセスできるように、誰でも問題を解決できますか?

Divya Teja Y さん、ありがとうございます。

0 投票する
1 に答える
779 参照

sql - Running a query over past date ranges

I have a rather interesting problem which I first thought would be straight-forward, but it turned out to be more complicated.

I have data like this:

Each row has a Date, User ID couple which indicates that that user was active on that day. A user can appear on multiple dates and a date will have multiple users -- just like in the example. I have millions of rows like this which cover a time range of about 90 days.

Here's the question: For each day, I want to get the number of users who have not been active for the past 10 days. For instance, if the user "a" was active on 2012-05-31 and but hasn't been active on any of the days between 06-01 and 06-10, I want to count this user on 6/10. I wouldn't count him again on the following days though unless he becomes active and disappears again.

Can I do this in SQL or would I need to some kind of script to organize the data the way I want. What would be your recommendations? I use Hive.

Thank you so much!

0 投票する
1 に答える
4626 参照

hadoop - SquirrelSQL クライアントを使用して Hive サーバーに接続する

SquirrelSQL クライアントHiveに接続しようとしています。

virtualbox の Debian 7.0 VM で Hadoop/Hive を実行しています。

Hive サーバーがオンラインで、ラップトップ クライアントで VM に ping を実行すると、VM が応答し、問題ありません。

次に、SquirrelSQL を使用して Hive に接続しようとしています。

この投稿に関連して、Amazon JDBC ドライバーを使用しています: Access Hive Tables in SQLClient but not from the Putty

接続は問題ありませんが、クライアントに一意のテーブル (支払い) が表示されず (テーブルがまったくありません!)、単純なクエリで一意のテーブルを選択しようとすると、次のSELECT * FROM pays;エラーが発生します: :

Web で問題を探しましたが、何も見つかりませんでした。

助けてくれてありがとう =)

ps: 下手な英語でごめんなさい...

0 投票する
18 に答える
203928 参照

hadoop - Hiveの内部テーブルと外部テーブルの違いは?

Hive の外部テーブルと内部テーブルの違いを教えてください。テーブルをドロップすると違いが生じることを私は知っています。データとメタデータが内部で削除され、メタデータのみが外部テーブルで削除されるという意味がわかりません。ノードに関して誰か説明してくれませんか。