Hadoop クラスターで Hive ジョブを実行しています。異なる動作マッパーとリデューサーに集中するだけで、パフォーマンスが向上/変化することを知りました。しかし、私はそれまで遊んだことがありません。いいえまで、Hive で遊んで、デフォルトのマッパーとリデューサーでクエリを実行しましたか?
マッパーとレデューサーについて知っているので、パフォーマンスが得られるようにマッパーとレデューサーに設定する値が異なることを心配しています。また、マスター ノードのみに設定する必要があるのか、それともすべてのノードに設定する必要があるのか も考えています。
これに関連する考えがある人は、これについてのシナリオを説明してください。
また、ジョブの実行中に設定する必要がある他のパラメーターは何ですか?