apache-spark - スパークSQLでのHadoopのマップ結合と同等

翻译自：https://stackoverflow.com/questions/26023875 2014-09-24T18:25:23.713

1189 次

1

SparkでHadoopのmapjoinに相当するものを探していますが、これを見つけることができましたspark.sql.autoBroadcastJoinThreshold

spark SQL で問題なく動作しますか? 試してみましたが、シャッフルの読み書きはパラメータをつけてもつけなくても同じで効果がないようでした。

この値を設定してクエリを実行しましたsqlContext.sql("SET spark.sql.autoBroadcastJoinThreshold=100000000;")

SPARK-SQL に他の同等の概念はありますか?

ありがとう ..

1 に答える 1

0

これは Spark 1.1.0 で導入されました。
これは、Spark テストスイートで (少し) テストされています。 PlannerSuiteを参照してください。
あなたのSETクエリは、それをサポートしていないバージョンの Spark によって元気よく静かに飲み込まれます - 私はちょうど 1.0.2 でそれを試しました。

于 2014-09-24T21:56:59.557 に答える