次のリンクを参照しています:Hive Support for Spark
それは言います:
「Spark SQL は、Hive とは異なるユース ケースをサポートしています。」
なぜそうなるのかはわかりません。これは、Hive ユーザーとして、Spark SQL を介して Spark 実行エンジンを使用できないということですか?
いくつかの質問:
- Spark SQL は Hive クエリ パーサーを使用します。したがって、理想的にはすべての Hive 機能をサポートします。
- Hive メタストアを使用しますか?
- Hive は Spark オプティマイザーを使用しますか、それとも独自のオプティマイザーを構築しますか?
- Hive は MR ジョブを Spark に変換しますか? それとも他のパラダイムを使用しますか?