私は持っていて、次のJavaPairRDD<String, String> results
ように呼び出して保存します:
results.saveAsTextFile("data")
次に、次のようなファイルのコンテンツを取得します。
(www.abc.com,0.15712321 www.def.com,www.aaa.com,www.ccc.com)
ここで、Shark を使用して次のような 3 つのフィールドを持つテーブルを作成します。
url STRING | rank DOUBLE | links STRING
www.abc.com | 0.15712321 | www.def.com,www.aaa.com,www.ccc.com
どうやってやるの?