SQL Server データベース テーブルの重複を削減しようとしていますが、基準が複雑です。すべてのテーブル データは Python に取り込まれていますlist
。
このステップでは、リスト内包表記を使用して、1 つの値が行に重複があるの値とlist
一致する場合に、特定のフィールド値を見つけたいと考えています。list
list
list
A はdupID
s の一意のリストです。[134L, 1610L, 1861L, 2026L, 3211L, 4134L, 4363L, 4453L, 4733L,...]
list
B は 2 次元です。
Row# dupID nameID SSN personID
[[85097L, 236479L, 241583, '999-99-0000', 359913, datetime.datetime(2012, 9, 9, 0, 0)]
[78654L, 236479L, 996783, '999-99-0000', NULL, datetime.datetime(2008, 5, 4, 0, 0)]...]
リスト内包表記で高速化したいループは次のとおりです。
personIDList = []
for i in range(len(A)):
for j in range(len(B)):
if A[i] == B[j][1]: # if dupID == dupID
personIDList.append(B[j][4]) # append personID