私は得続けます
java.lang.NoClassDefFoundError: org/apache/avro/mapred/AvroWrapper
show()
DataFrame オブジェクトを呼び出すとき。シェル (spark-shell --master yarn) を介してこれを実行しようとしています。DataFrame オブジェクトの作成時にシェルがスキーマを認識していることがわかりますが、データに対してアクションを実行するNoClassDefFoundError
と、インスタンス化しようとすると常に がスローされますAvroWrapper
。avro-mapred-1.8.0.jar
クラスターのディレクトリに追加しようとしまし$HDFS_USER/lib
たが、シェルの起動時に --jar オプションを使用して含めました。これらのオプションはどちらも機能しませんでした。アドバイスをいただければ幸いです。以下はコード例です。
scala> import org.apache.spark.sql._
scala> import com.databricks.spark.avro._
scala> val sqc = new SQLContext(sc)
scala> val df = sqc.read.avro("my_avro_file") // recognizes the schema and creates the DataFrame object
scala> df.show // this is where I get NoClassDefFoundError