mllib モデルをトレーニングした後、オンライン システムのすべての着信アイテムを DataFrame に変換して、予測/変換のようなメソッドを呼び出す必要がありますか? 時間/メモリ関連の問題のリスクが高いやり過ぎのように見えます。
どうにかして1つの行だけを構築/変換/予測できますか? (Scala でのソリューションが望ましい)
著者がこのために独自の何かを実装したと言っているテキストを見つけました: https://www.oreilly.com/ideas/training-and-serving-nlp-models-using-spark-mllib