各行にスペースで区切られた数字を含むファイルがあります。各行は番号のリストに対応しています。
現在、そのような行は約300,000行あります(各行には平均で約100個の数字が含まれています)。
そのようなすべてのリストの相互交差を見つけたいと思います。つまり、最初のリストが他のすべてのリストと交差し、次に2番目のリストが他のすべてのリストと交差するというように続きます。
使ってます
set(a) & set(b)
ここで、aとbはリストであり、二重ループで反復されます。
しかし、これには時間がかかりすぎます。例:最初のリストが他のすべてのリストと交差している場合、約3分かかりました。
どうすればこれを効率的に行うことができますか?(他の言語/ツールを使用している可能性があります)