9

Apache GraphX で次のような入力を取得したとします。

頂点 RDD:

val vertexArray = Array(
  (1L, "Alice"),
  (2L, "Bob"),
  (3L, "Charlie"),
  (4L, "David"),
  (5L, "Ed"),
  (6L, "Fran")
)

エッジ RDD:

val edgeArray = Array(
  Edge(1L, 2L, 1),
  Edge(2L, 3L, 1),
  Edge(3L, 4L, 1),
  Edge(5L, 6L, 1)
)

Apache Spark GraphX のノードに接続されたすべてのコンポーネントが必要です

1,[1,2,3,4]
5,[5,6]
4

1 に答える 1

11

あなたはConnectedComponentsどのリターンを使用することができます

その頂点を含む接続コンポーネントで最小の頂点 ID を含む頂点値を持つグラフ。

結果を再形成する

graph.connectedComponents.vertices.map(_.swap).groupByKey
于 2015-09-16T06:58:50.317 に答える