45

dataframeを に変換する方法を教えてくださいRDD

4

3 に答える 3

70

Simply:

val rows: RDD[Row] = df.rdd
于 2015-09-11T20:04:42.107 に答える
3

df.map(row => ...)行を別の RDD 要素にマップする場合は、データフレームを RDD に変換するために使用します。例えば

df.map(row => (row(1), row(2)))

df の最初の列がキーで、df の 2 番目の列が値であるペアの RDD を提供します。

于 2016-10-28T18:54:20.820 に答える
3

私は自分の答えを探していて、この投稿を見つけました。

その「df.rdd」を追加すると、RDD [Rows]が返されます。RDD を取得したら、split() を適用する必要があります。そのためには、RDD[Row} を RDD[String] に変換する必要があります。

val opt=spark.sql("select tags from cvs").map(x=>x.toString()).rdd
于 2016-11-17T12:15:56.150 に答える