Option[Seq[String]] 型のいくつかの列がデータ ソースにない場合、データのエンコードに問題があります。理想的には、欠落している列データを で埋めたいと思いますNone
。
シナリオ:
column1を含むがcolumn2を含まないいくつかの寄木細工のファイルを読み込んでいます。
これらの寄木細工のファイルからのデータを にロードし、Dataset
としてキャストしMyType
ます。
case class MyType(column1: Option[String], column2: Option[Seq[String]])
sqlContext.read.parquet("dataSource.parquet").as[MyType]
org.apache.spark.sql.AnalysisException:
column2
指定された入力列 ' ' を解決できません: [column1];
column2 データを としてデータセットを作成する方法はありますNone
か?