Naive Bayes Model をトレーニングするためにクロス検証プロセスを使用してきましたが、 kFoldメソッドを使用してランダム サンプリング データを取得し、フォールドを作成することを認識しています。このメソッドArray[(RDD[T], RDD[T])]
は、トレーニングとテストのための折り畳みのさまざまな組み合わせのセットであると思うタプルの を返します。
私の質問は、API では独自の折り畳み配列を定義できないため、特定の理由があるかどうかです。その機能が必要であり、その機能をサポートするには、独自の CrossValidator クラスを作成する必要があると推測しています。アドバイスもお待ちしております。