SparktakeSample()
で関数を使用しようとしていますが、パラメーターは -データ、取得するサンプル数、およびシードです。しかし、私は種を使いたくありません。毎回違う答えが欲しい。どうすればそれができるのかわかりません。シード値として使用しようとしましたが、データ型が一致していないと思われるため、エラーが発生しました。シードなしで使用できる他の機能はありますか? または、毎回異なる出力を得るために使用できる他の実装はありますか?System.nanoTime
takeSample()
takeSample()
4708 次
3 に答える
1
System.nanoTime
takeSample は Int を想定していますが、Long を返します。takeSample 関数にシード値として
フィードできます。scala.util.Random.nextInt
于 2013-02-04T13:54:50.930 に答える
1
Spark バージョン 1.0.0 以降、seed
パラメーターはオプションです。https://issues.apache.org/jira/browse/SPARK-1438を参照してください。
于 2014-12-08T14:27:59.057 に答える