次のようなタプルのリストが与えられた場合:
a = [ ( "x", 1, ), ( "x", 2, ), ( "y", 1, ), ( "y", 3, ), ( "y", 4, ) ]
一意の最初の要素をフィルタリングし、2 番目の要素をマージする最も簡単な方法は何でしょうか。そのような出力が望まれます。
b = [ ( "x", 1, 2 ), ( "y", 1, 3, 4 ) ]
ありがとう、
次を使用できますdefaultdict
。
>>> from collections import defaultdict
>>> d = defaultdict(tuple)
>>> a = [('x', 1), ('x', 2), ('y', 1), ('y', 3), ('y', 4)]
>>> for tup in a:
... d[tup[0]] += (tup[1],)
...
>>> [tuple(x for y in i for x in y) for i in d.items()]
[('y', 1, 3, 4), ('x', 1, 2)]
これは私が思いついたものです:
[tuple(list(el) + [q[1] for q in a if q[0]==el]) for el in set([q[0] for q in a])]
以前の回答に加えて、別のワンライナー:
>>> a = [ ( "x", 1, ), ( "x", 2, ), ( "y", 1, ), ( "y", 3, ), ( "y", 4, ) ]
>>> from itertools import groupby
>>> [(key,) + tuple(elem for _, elem in group) for key, group in groupby(a, lambda pair: pair[0])]
[('x', 1, 2), ('y', 1, 3, 4)]
1 つの方法は、リスト内包表記をitertools.groupby
,itertools.chain
およびoperator.itemgetter
as で使用することです。
>>> from itertools import groupby, chain
>>> from operator import itemgetter
>>> my_list = [ ( "x", 1, ), ( "x", 2, ), ( "y", 1, ), ( "y", 3, ), ( "y", 4, ) ]
>>> [set(chain(*i)) for _, i in groupby(sorted(my_list), key=itemgetter(0))]
[set(['x', 2, 1]), set(['y', 1, 3, 4])]
注: set
は本質的に順序付けされていないため、要素の位置は保持されません。set
位置が重要な場合は使用しないでください。