問題タブ [apache-hive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
21 参照

hadoop - Apache Hive: 既存のテーブルから別のテーブルへのデータの転送

hdfsに複数の既存のテーブルが保存されています。データをバケット化、ソート、および圧縮できるように、既存の外部テーブルから新しいテーブルを作成したいと考えています。

既存のテーブルからテーブルを作成する適切な方法は何ですか? 既存のテーブルを CSV にエクスポートし、新しいテーブルを作成してインポートできますが、既存のテーブルから直接データをインポートする方法があるようですが、ドキュメントや Google 経由で何も見つかりませんでした。

0 投票する
1 に答える
3908 参照

view - サブクエリを使用した Hive LATERAL VIEW および WHERE 句

クエリを最適化する方法を探しています。

という名前のイベントを含むテーブルがありlea、列app_propertiesはタグであり、カンマ区切りの文字列として保存されています。

目的のタグを選択するクエリの結果に一致するすべてのイベントを選択したいと考えています。

私の最初の試み:

しかし、Hive はこれを許可しません...

FAILED: SemanticException [Error 10249]: Line 4:6 Unsupported SubQuery Expression 'tag': Correlating expression cannot contain unqualified column references.

運ではなく、置き換えてもう一度試してみましたWHERE tag IN...WHERE tag_table.tag IN

FAILED: SemanticException Line 4:6 Invalid table alias tag_table' in definition of SubQuery sq_1 [tag_table.tag IN (SELECT source_value FROM mapping WHERE indicator = 'Bandwidth Usage')] used as sq_1 at Line 4:20.

最後に...以下のクエリは望ましい結果をもたらしますが、これはこのユースケースを解決するための最も最適化された方法ではないと感じています。LATERAL VIEWaを使用して aからの選択が必要な同じユースケースに遭遇した人はいますSub queryか?

0 投票する
2 に答える
3459 参照

hive - Apache Hive クライアントが NoSuchFieldError をスローする: HIVE_CLI_SERVICE_PROTOCOL_V8

Hive2 を接続して、そこから情報を取得する必要があります。POMでHiveに接続するためにapache HiveServer2クライアントを使用しています:

コードは次のとおりです。

しかし、このアプリを実行すると、次の例外が発生しました。

この例外がどのようにスローされるか教えてもらえますか?

0 投票する
1 に答える
2381 参照

hadoop - default.fs.name と hive.metastore.warehouse.dir が競合しない

こんにちは、以下のコマンドを実行しようとすると

ハイブシェルでは、次のエラーがスローされます

私のdefault.fs.nameプロパティはどこですか

私の hive.metastore.warehouse.dir はどこにありますか

誰でもこれで私を助けることができますか?

0 投票する
1 に答える
1590 参照

python - Apache Hive getting error while using Python UDF

I am using Python user defined function in Apache hive to change characters from lower case character to upper case. I am getting error as "Hive Runtime Error while closing operators".

Below are the query I tried:

From the above table, item and city field should change from lower case to upper case and count should increment by 10.

Python script used:

Inserting table1 data to table2

If I execute I am getting the following error. I could'nt able to trace the issue. Can I know it going wrong?

0 投票する
1 に答える
839 参照

apache-spark - ハイブの Spark でユーザー同時実行が機能しない

Hive 0.13.1 バージョンで 3 ノード Spark (バージョン 1.4.0) クラスター環境を構成しました。./sbin/start-thriftserver.shを使用して Spark thrift サービスを開始しました。

複数のユーザーが、同じポートと異なるユーザー名で同じリサイクル サービスを使用しています。

しかし、問題は、1 人のユーザーがuse mytestのようなクエリを実行したときです。その後、データベースの変更は自動的に他のユーザーに反映されます。

0 投票する
1 に答える
1245 参照

postgresql - Hadoop の並列処理能力を失わずに SAS と Hadoop を統合する最善の方法は何ですか?

SAS と Hadoop の統合を理解しようとしています。私が理解していることから、proc sql のような SAS プロセスは SAS データセットに対してのみ機能し、hadoop ノード上のテキスト ファイルに対して proc sql を発行することはできません。それが正しいか?

はいの場合、ETL ジョブを使用して、最初に HDFS からデータを取得し、SAS テーブルに変換する必要があります。しかし、そうすると Hadoop の並列処理能力が失われてしまいますよね?

では、SAS と Hadoop を統合し、Hadoop の並列処理能力を引き続き使用するには、どのような方法が理想的でしょうか?

SAS 内からマップ リデュース ジョブを呼び出せることは承知していますが、SAS でマップ リデュース ジョブを記述できますか? ないと思います。