グラフのどのエッジが双方向であるかを調べようとしています。各行はエッジです。開始ノード A ごとに、対応する各終了ノード B を、ノード A が終了点としてある場合に検索しています。
for ending_point_B in nodeA:
nodeA in ending_points_of_B
df['S'] で繰り返されるエントリを無視します。この検索を最適化するにはどうすればよいですか? groupby に沿った何かを疑っています。この方法では、実際のグラフには時間がかかりすぎます。
ありがとうございました
from pandas import *
def missing_node(node):
set1 = set(df[df.E == node].S.values)
set2 = set(df.E[df.S == node].values)
return list(set1.difference(set2))
x = [1,1,2,2,3]
y = [2,3,1,3,1]
df = DataFrame([x,y]).T
df.columns = ['S','E'] #Start & End
df['Missing'] = df.S.apply(missing_node)
df:
S E Missing
0 1 2 []
1 1 3 []
2 2 1 []
3 2 3 []
4 3 1 [2]