1

私はスパークにまったく慣れていないので、ファイルから入力を読み取らずに、ラベル付きのポイントからプログラムで JavaRDD を作成したいと考えています。次のようにいくつかのラベル付きポイントを作成するとします。

 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 5.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 7.0, 3.0));

次に、これらのベクトルを使用して JavaRDD を作成したいと考えています。どうやってやるの。

4

1 に答える 1

5

Apache spark documentation のこのセクションを確認してください。parallelize 関数を使用して rdd を作成できます。

List<Integer> data = Arrays.asList(1, 2, 3, 4, 5);
JavaRDD<Integer> distData = sc.parallelize(data);
于 2016-02-21T04:50:19.730 に答える