3

私がPythonでリストを持っているなら

thing = [[20,0,1],[20,0,2],[20,1,1],[20,0],[30,1,1]]

結果のリストが欲しい

thing = [[20,1,1],[20,0,2],[30,1,1]]

つまり、最初の要素が同じ場合は、重複を取り除き、2 番目の要素の番号 1 を優先します。最後に、3 番目の要素も最初の要素に対して一意である必要があります。

この前の質問では、トランザクションの購入単位を詳述する複雑な方法を解決しました。そのコースで他の単位を出力したい。1 つのコースの 2 つのユニットに関連する 2 つのトランザクションが存在する場合、それらは重複して表示されます (または後続の各ユニットの時間)。

この質問の目的は、この重複を確実に止めることです。このソリューションは複雑であるため、一連の疑問が生じました。これまで助けてくれたすべての人に感謝します。

4

3 に答える 3

2

itertools レシピunique_everseenの関数を使用してみてください。

最初のステップとして、以下を除くソリューションを次に示し[20, 0]ます。

from itertools import filterfalse

def unique_everseen(iterable, key=None):
    "List unique elements, preserving order. Remember all elements ever seen."
    # unique_everseen('AAAABBBCCDAABBB') --> A B C D
    # unique_everseen('ABBCcAD', str.lower) --> A B C D
    seen = set()
    seen_add = seen.add
    if key is None:
        for element in filterfalse(seen.__contains__, iterable):
            seen_add(element)
            yield element
    else:
        for element in iterable:
            k = key(element)
            if k not in seen:
                seen_add(k)
                yield element

thing = [[20,0,1],[20,0,2],[20,1,1],[30,1,1]]

thing.sort(key=lambda x: 0 if x[1] == 1 else 1)

print(list(unique_everseen(thing, key=lambda x: (x[0], x[2]))))

出力:

[[20, 1, 1], [30, 1, 1], [20, 0, 2]]
于 2013-07-26T12:20:13.597 に答える