ここに pyspark スクリプト行があります。
df_output = df.select("*",$checkcol)
df_output.show()
変数をハードコーディングすることで正常に機能しますが、パラメーター化すると、次のようなエラーがスローされます。
pyspark.sql.utils.AnalysisException: '\'`"*" を解決できません、F.....
ここcheckcol
で、以下のような値を持つ変数です。
チェックコル -
F.when(F.col("colA")=='null',"Yes").otherwise(date_validation_udf("colA")).alias("colA_DateCheck"),
F.when(F.col("colB")=='null',"Yes").otherwise(date_validation_udf("colB")).alias("colB_DateCheck"),F.when(F.col("colC")=='null',"Yes").otherwise(date_validation_udf("colC")).alias("colC_DateCheck"),
F.when(F.col("colD")=='null',"Yes").otherwise(num_check_udf("colD")).alias("colD_NumCheck"),F.when(F.col("colE")=='null',"Yes").otherwise(num_check_udf("colE")).alias("colE_NumCheck"),
F.when(F.col("colF")=='null',"Yes").otherwise(num_check_udf("colF")).alias("colF_NumCheck"),F.when(F.col("colG")=='null',"Yes").otherwise(num_check_udf("colG")).alias("colG_NumCheck")