ハイブがクエリ、特にカスタム UDF を実行する方法に興味があります。4 つのデータノードがあるため、4 つの異なる VM に 4 つのタスク トラッカーがあります。
データノードのデータは暗号化され、UDF はデータを復号化します。Hive がこの UDF をどのように実行するのか興味があります。
1) 各タスクトラッカーは、そのデータノードにあるデータを取得し、それを復号化して返します
2) ジョブ トラッカーはすべての暗号化されたデータを取得し、復号化を 4 つのタスク トラッカーすべてに委任します。
私の質問が明確であることを願っています...