次のスキーマを持つ DataFrame があるx
とします。
xSchema = StructType([ \
StructField("a", DoubleType(), True), \
StructField("b", DoubleType(), True), \
StructField("c", DoubleType(), True)])
次に、DataFrame を取得します。
DataFrame[a :double, b:double, c:double]
整数の派生列が必要です。ブール列を作成できます:
x = x.withColumn('y', (x.a-x.b)/x.c > 1)
私の新しいスキーマは次のとおりです。
DataFrame[a :double, b:double, c:double, y: boolean]
y
ただし、列に False の場合は 0、True の場合は 1 を含めたいと思います。
cast
関数は列ではなく でDataFrame
のみ操作でき、関数withColumn
は でのみ操作できDataFrame
ます。新しい列を追加して同時に整数にキャストするにはどうすればよいですか?