Spark コードから HiveContext を使用してハイブ クエリを実行しています。実行するクエリとそのデータ量に関係なく、常に 31 個のパーティションが生成されます。誰も理由を知っていますか?定義済み/構成可能な設定はありますか? 基本的に、より多くのパーティションが必要です。
このコード スニペットを使用してハイブ クエリを実行します。
var pairedRDD = hqlContext.sql(hql).rdd.map(...)
Spark 1.3.1 を使用しています
ありがとう、ニティン