0

次のように、ファイルを解析してリストを生成する python スクリプトがあり.txtます。

['test=testTC101', 'test=testTC101', 'test=testTC102', 'test=testTC102', 'test=testTC103', 'test=testTC103', 'test=testTC104', 'test=testTC104', 'test=testTC105', 'test=testTC105', 'test=testTC106', 'test=testTC106', 'test=testTC107', 'test=testTC107']

重複を排除する必要があります。どうすればそれを達成できますか?

4

2 に答える 2

1

順序を維持する必要がある場合:

def best_case_iteruniq(iterable, key=None):
    memo_hash = set()
    memo_else = list()

    add_hash = memo_hash.add
    add_else = memo_else.append

    if key is None:
        def predicate(item):
            try:
                hash(item)

            except TypeError:
                if item in memo_else:
                    return False

                add_else(item)
                return True

            else:
                if item in memo_hash:
                    return False

                add_hash(item)
                return True


    else:
        def predicate(actual_item):
            item = key(actual_item)

            try:
                hash(item)

            except TypeError:
                if item in memo_else:
                    return False

                add_else(item)
                return True

            else:
                if item in memo_hash:
                    return False

                add_hash(item)
                return True

    return filter(predicate, iterable)

これは私が少し前に作った小さなツールで、ハッシュ可能な要素とハッシュ不可能な要素の両方のリストを最小限の時間で一意化することができます (完全に順序付けられたハッシュ不可能な要素がないことを前提としています)。keyそれらを一意にします。

ただし、このシナリオではほぼ間違いなくやり過ぎです。しかし、それはそこにあり、無料です。

于 2013-09-24T20:58:55.573 に答える