java - Java を使用して作成された 2 つの RDD での Spark SQL 結合

翻译自：https://stackoverflow.com/questions/27268965 2014-12-03T10:15:38.603

446 次

2 つの RDD を作成し、Java を使用して永続化しました。ジャーをスパークマスターに提出しました。ここで、spark シェルからクエリの入力を求められたときに、SQL ステートメントの結合条件を 2 つの RDD に指定しました。次に、結果セットで collect() を実行中に例外をスローします。

JOIN 条件 : TABLE_1 から a.ID を JOIN TABLE_2 b ON a.NAME = b.NAME; として選択します。

例外: resultSet.collect() の Null ポインター例外

PS: resultSet.collect(); の前に結果セットが null かどうかを確認しました。それでも状態に入り、NPE をスローします。私はspark-sql-1.1.1 jar(最新)を使用しています。

SPARK SQL の JOIN に何か問題がありますか?

java - Java を使用して作成された 2 つの RDD での Spark SQL 結合

1 に答える 1

Related

Reference