7

SparktakeSample()で関数を使用しようとしていますが、パラメーターは -データ、取得するサンプル数、およびシードです。しかし、私は種を使いたくありません。毎回違う答えが欲しい。どうすればそれができるのかわかりません。シード値として使用しようとしましたが、データ型が一致していないと思われるため、エラーが発生しました。シードなしで使用できる他の機能はありますか? または、毎回異なる出力を得るために使用できる他の実装はありますか?System.nanoTimetakeSample()takeSample()

4

3 に答える 3

1

System.nanoTimetakeSample は Int を想定していますが、Long を返します。takeSample 関数にシード値として
フィードできます。scala.util.Random.nextInt

于 2013-02-04T13:54:50.930 に答える
1

Spark バージョン 1.0.0 以降、seedパラメーターはオプションです。https://issues.apache.org/jira/browse/SPARK-1438を参照してください。

于 2014-12-08T14:27:59.057 に答える