2 つの RDD を作成し、Java を使用して永続化しました。ジャーをスパークマスターに提出しました。ここで、spark シェルからクエリの入力を求められたときに、SQL ステートメントの結合条件を 2 つの RDD に指定しました。次に、結果セットで collect() を実行中に例外をスローします。
JOIN 条件 : TABLE_1 から a.ID を JOIN TABLE_2 b ON a.NAME = b.NAME; として選択します。
例外: resultSet.collect() の Null ポインター例外
PS: resultSet.collect(); の前に結果セットが null かどうかを確認しました。それでも状態に入り、NPE をスローします。私はspark-sql-1.1.1 jar(最新)を使用しています。
SPARK SQL の JOIN に何か問題がありますか?