次のようなテキストファイルがあります。
1 3
2 5
3 6
4 5
5 4
6 1
7 2
上記のファイルは、無向グラフのエッジを表しています。グラフ内の重複したエッジを削除したい。上記の例では4,5 or 5,4
、グラフ内の同じエッジを表しているため、重複を引き起こすため、どちらかを削除したいと考えています。Apache SparkGraphstream
のライブラリを使用して、ファイルからグラフを視覚化しようとしています。GraphX
ただし、上記で説明したように重複ノードが存在するため、次のようなエラーが発生します
org.graphstream.graph.EdgeRejectedException: Edge 4[5--4] was rejected by node 5
このような重複をテキスト ファイルから削除するにはどうすればよいでしょうか?