article というデータフレームがあります
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
平らにして言葉の袋にしたい。現在の状況を使用してこれをどのように達成できますか。以下のコードを試してみましたが、タイプの不一致の問題が発生しているようです。
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
最終的には、この bow_corpus を使用して word2vec モデルをトレーニングしたいと考えています。
ありがとう