hadoop - ハイブクエリと udf 実行戦略

翻译自：https://stackoverflow.com/questions/13058870 2012-10-24T22:35:16.910

291 次

ハイブがクエリ、特にカスタム UDF を実行する方法に興味があります。4 つのデータノードがあるため、4 つの異なる VM に 4 つのタスクトラッカーがあります。

データノードのデータは暗号化され、UDF はデータを復号化します。Hive がこの UDF をどのように実行するのか興味があります。

1) 各タスクトラッカーは、そのデータノードにあるデータを取得し、それを復号化して返します

2) ジョブトラッカーはすべての暗号化されたデータを取得し、復号化を 4 つのタスクトラッカーすべてに委任します。

私の質問が明確であることを願っています...

hadoop - ハイブ クエリと udf 実行戦略