それらが 1 行だけの場合は、setオブジェクト (python 組み込み) を使用してそれらを比較できます。たとえば、次のようになります。
>>> a = ['A123','B456','C789','D007']
>>> b = ['B456','D007','E009']
>>> c = list(set(a).intersection(b))
>>> print c
['B456', 'D007']
ファイルから比較する完全な方法は次のようになります。
def compare( fileA, fileB ):
a_file = open(fileA, 'r')
a_data = a_file.read()
a_file.close()
b_file = open(fileB, 'r')
b_data = b_file.read()
b_file.close()
# compare the contents
a_set = set(a_data.split(','))
b_set = set(b_data.split(','))
return list(a_set.intersection(b_set))
compare('more.csv', 'less.csv')
それらがファイルごとに複数の行である場合でも、これを使用できます。少し変更するだけで済みます-交点を行ごとの類似性を表す配列に格納すると思いますか何か。