“tez”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

913 参照

hadoop - HDP 2.2 から 2.3 にアップグレードした後、Tez の Hive が Hue で動作しません (エラー: クライアントバージョン = 不明)

Hadoop クラスター用に HortonWorks を 2.2 から 2.3 にアップグレードし、必要なすべての変更を Hue に加えました (HortonWorks のドキュメントに記載されています) が、Hive ブラウザーで Tez にアクセスすると、Hive CLI で Tez が完全に正常に動作するのに対して、Hue クライアントには次の問題があります。以前 (HDP 2.2)、Tez は Hue と互換性がありましたが、HDP 2.3 で Tez を使用する Hue クライアントに問題はありますか?

問題 1: HDP 2.2 を 2.3 にアップグレードした後も、Tez は HDFS とローカルの場所で HDP 2.2 ライブラリファイルを探します。HDP 2.2 の場所:

HDFS: /hdp/apps/2.2.9.0-3393

ローカルファイル: /usr/hdp/2.2.9.0-3393

問題 1 の一時的な解決策: 2.3 のサポートファイルを 2.2 に移動しました。

HDFS:

ローカルファイル:

技術的には、Tez は 2.3.2.0-2950 である「/usr/hdp/current」ディレクトリを探す必要があります。

問題 2: Hue を介して Tez で Hive を実行すると、次のエラーが発生します。

エラー：

いくつかの調査により、Hive クエリの実行に Tez の実行が必要ない場合、Hue クライアントのバージョンは AM バージョンと一致するのに対し、tez の実行が必要なクエリは Hue クライアントのバージョンが不明として表示されることがわかりました。

Tez の実行が不要な場合、クライアントバージョンと AM バージョンは一致します。

アプリケーション appattempt_1470224940790_0082_000001 の DAGAppMaster を作成しました。 .org/repos/asf/tez.git , buildTime=20150930-1859 ] [INFO] [main] |app.DAGAppMaster|: クライアントバージョンと AM バージョンの比較、clientVersion=0.7.0.2.3.2.0-2950、AMVersion= 0.7.0.2.3.2.0-2950
Tez の実行が有効になっている場合、クライアントのバージョンと AM のバージョンが一致しません。

アプリケーション appattempt_1470224940790_0092_000001 用の DAGAppMaster を作成しました。 .org/repos/asf/tez.git , buildTime=20150930-1859 ] クライアントバージョンと AM バージョンの比較、clientVersion=Unknown、AMVersion=0.7.0.2.3.2.0-2950 [エラー] [main] |app.DAGAppMaster| : 互換性のないバージョンが見つかりました。clientVersion=Unknown、AMVersion=0.7.0.2.3.2.0-2950

HDP 2.3 で Hue を介して Tez が有効になっている場合、互換性のないバージョンエラーの解決策を見つける方法を教えてください。

2016-08-19T10:55:42.407

0 投票する

0 に答える

186 参照

csv - Hadoop からハイブへの CSV ロード - スケーラビリティの問題 20GB/h

prestoでクエリを実行する場所から、hadoopからハイブへのデータのロードを高速化する方法を探しています。私のワークフローでは、hadoop で単一の csv ファイルから始めます。

インスタント、csv のビューのみを作成します。
次に、すべてのカウントはすでにかなり遅いです...

ターゲットテーブルは次のように準備されます。

そして読み込まれました：

この単一のテーブルは、hadoop からハイブにロードするのに約 5 時間以上かかります。2 つの整数列を持つ 103 GB の csv には長すぎませんか? 理想的には、5e9 のより良いスケーリングだけでなく、より大きなセットも目指します。
250GB の 10 台のマシンのクラスターがそれを処理する必要があります。それは私のバージョンに何らかの形で関連しているのでしょうhive-0.14.0.2.2.6.3か ( )、またはカスタム設定がここで役割を果たすことができますか?

csv hadoop hive presto tez

2016-09-03T18:12:10.557

0 投票する

1 に答える

596 参照

hadoop - Tez で Spark / Flink を実行するのはなぜですか?

Saha らのTez 論文では、Tez を使用した Hadoop 2 の次のモジュラーアーキテクチャが示されています。

Hadoop 2 と Tez

誰かが Tez で Spark/Flink を実行するのはなぜですか?

利点は何ですか？YARNのより良い利用？

hadoop apache-spark apache-flink apache-tez tez

2016-09-09T12:42:49.703

0 投票する

0 に答える

328 参照

hadoop - ハイブはテーブルを作成し、データを挿入しません

以下のハイブクエリを実行しています。mapreduce が完了すると、データが挿入されていないことがわかります。

しかし、以下のように選択クエリを実行すると、結果が得られます。t1、t2、t3 のデータ型は同じです。最後に、次のステートメントを取得します。

"numFiles = 27 , numRows = 0 and totalSize = 34567...."

問題になる可能性のある考え。TEZを使用してこれを実行しています。

hadoop mapreduce hive tez

2016-09-15T12:55:06.473

0 投票する

0 に答える

305 参照

hive - Tez のジョブ履歴にアクセスする

tez 実行エンジンのジョブ履歴サーバーからジョブ情報を取得したいと考えています。

現在、すべての map reduce ジョブはジョブ履歴サーバーに反映されますが、tez のジョブには反映されません。

ジョブ履歴は、何らかのログを使用してすべての情報を取得しています。これらのログはどこにありますか? ジョブ履歴サーバーで情報が利用できない場合は、それらのログを解析して必要な情報を取得できます。

すでに pig-tez コマンドログの解析を試みました。十分な情報が含まれておらず、tez 上のハイブでは機能しない解析。

hive apache-pig hadoop2 tez bigdata

2016-10-18T06:33:52.867

0 投票する

4 に答える

20749 参照

hadoop - Tez のコンテナーの物理メモリを増やすにはどうすればよいですか?

aws emr 4.8ハイブ 1.0 と tez 0.8のクラスターでいくつかのハイブスクリプトを実行しています。

私の構成は次のようになります。

そして、私のグローバル設定は次のとおりです。

スクリプトの実行中に、次のエラーが発生します。

このエラーをグーグルで調べたところ、セットtez.task.resource.memory.mbが物理メモリの制限を変更することを読みましたが、明らかに間違っていました。私は何が欠けていますか？

hadoop hive amazon-emr apache-tez tez

2016-10-26T01:45:54.477

問題タブ [tez]

hadoop - HDP 2.2 から 2.3 にアップグレードした後、Tez の Hive が Hue で動作しません (エラー: クライアント バージョン = 不明)

csv - Hadoop からハイブへの CSV ロード - スケーラビリティの問題 20GB/h

hadoop - Tez で Spark / Flink を実行するのはなぜですか?

hadoop - ハイブはテーブルを作成し、データを挿入しません

hive - Tez のジョブ履歴にアクセスする

hadoop - Tez のコンテナーの物理メモリを増やすにはどうすればよいですか?

Reference

hadoop - HDP 2.2 から 2.3 にアップグレードした後、Tez の Hive が Hue で動作しません (エラー: クライアントバージョン = 不明)