hive.fetch.task.conversion
Hiveパラメーターを使用して、Map または MapReduce の代わりに、単純なクエリのために Hive で Fetch タスクを有効にすることができます。
特にいくつかの単純な作業を行う場合 (たとえばselect * from table limit 10;
) 、Fetch タスクが Map よりもはるかに高速に実行される理由を説明してください。この場合、追加で実行しているマップのみのタスクは何ですか? 私の場合、パフォーマンスの違いは 20 倍以上高速です。どちらのタスクもテーブル データを読み取る必要がありますね。