Scalaでデシジョンツリーシステムを構築していますが、データの一部のエントリに同じ属性があります。「ランダム」ノードタイプを実装して、クエリがトラバースするブランチをランダムに選択できるようにすることでこれを回避しましたが、残りの例をランダムに分割しようとすると「MatchError」が発生します。私の現在のコード:
def splitRandom(examples: Array[String]): Array[String]={
examples.collect {case x if(r.nextInt(100) < 50) => x}
}
「examples」は文字列の配列であり、各文字列は、すべての属性を持つ単一のデータエントリを含む行です。