df2 を kmeans にフィードしようとすると、次のエラーが発生します
clusters = KMeans.train(df2, 10, maxIterations=30,
runs=10, initializationMode="random")
私が得るエラー:
Cannot convert type <class 'pyspark.sql.types.Row'> into Vector
df2 は、次のように作成されたデータフレームです。
df = sqlContext.read.json("data/ALS3.json")
df2 = df.select('latitude','longitude')
df2.show()
latitude| longitude|
60.1643075| 24.9460844|
60.4686748| 22.2774728|
この 2 つの列を Vector に変換して KMeans にフィードするにはどうすればよいですか?