Python で 2 つの非常に大きなファイル (それぞれが 1.000.000 エントリを超える) に問題があります: フィルターを生成する必要がありますが、理由がわかりません。次のような 2 つのファイルがあります。
1,2,3
2,4,5
3,3,4
そして2番目
1,"fege"
2,"greger"
4,"feffg"
各ファイル行の最初の項目は常に ID です。最初のリストには、2 番目のファイルにある ID のアイテムのみが含まれるように、リストをフィルター処理したいと思います。この例では、結果は次のようになります。
1,2,3
2,4,5
これを非常に高速な方法で作成する方法は?中心的な問題は、各リストが非常に長いことです。私はsthを使用しました。このような:
[row for row in myRows if row[0] == item[0]]
しかし、これはスローを実行するのに長い時間がかかります。(30日以上)