この記事DataFrame
では、Spark の は と同等であると主張していますDataset[Row]
が、このブログ投稿DataFrame
では にスキーマがあることを示しています。
RDD をaに変換するブログ投稿の例を見てみましょうDataFrame
。DataFrame
Dataset[Row]
RDD
DataFrame
val rddToDF = rdd.map(value => Row(value))
しかし、代わりにそれがこれであることを示しています
val rddStringToRowRDD = rdd.map(value => Row(value))
val dfschema = StructType(Array(StructField("value",StringType)))
val rddToDF = sparkSession.createDataFrame(rddStringToRowRDD,dfschema)
val rDDToDataSet = rddToDF.as[String]
明らかに、データフレームは実際には行とスキーマのデータセットです。