Hive クエリの実行に関して質問があります。
クエリがあるとします:
select * from table where id > 5;
このクエリはツリーに変換され、小さなタスクに分割され、その特定のデータを持つデータノードに分散されます。
クエリが分散されると、クエリ全体がデータを持つすべてのノードに分散されますか? それとも、クエリの一部のみをノードに送信しますか?
クエリ全体をすべてのノードに送信する場合、データ ノードはクエリの一部のみを処理するのか、それともクエリ全体を処理するのか?
上記の場合、データノードプロセスの使用は何ですか