ハイブとは何かを読んだ後、それはデータベースですか? 、同僚は昨日、「グループ化」を行った後、15B テーブルをフィルタリングし、別のテーブルと結合して、わずか 10 分で 6B レコードを作成できたと述べました。これはSparkで遅くなるのだろうかと思います.DataFrameを使用すると、同等になる可能性がありますが、よくわからないので質問です。
Hive は Spark よりも高速ですか? それとも、この質問には意味がありませんか?申し訳ありませんが、私の無知のために。
彼は、Tez を使用しているように見える最新の Hive を使用しています。