1

私は持っていて、次のJavaPairRDD<String, String> resultsように呼び出して保存します:

results.saveAsTextFile("data")

次に、次のようなファイルのコンテンツを取得します。

(www.abc.com,0.15712321 www.def.com,www.aaa.com,www.ccc.com)

ここで、Shark を使用して次のような 3 つのフィールドを持つテーブルを作成します。

url STRING  | rank DOUBLE | links STRING
www.abc.com | 0.15712321  | www.def.com,www.aaa.com,www.ccc.com

どうやってやるの?

4

1 に答える 1

0

私が今得ている解決策は、に変換するJavaPairRDD<String, String>ことですJavaRDD<String>

JavaRDD<String> ret = results.map(new Function<Tuple2<String, String>, String>() {
    @Override
    public String call(Tuple2<String, String> pair) {
        return pair._1() + " " + pair._2();
    }
});
ret.saveAsTextFile("data");

次に、次のようなファイルを取得します。

www.abc.com 0.15712321 www.def.com,www.aaa.com,www.ccc.com

これで、テーブルを簡単に作成できます。

于 2014-09-29T01:38:18.567 に答える