txtファイルから取り出した40語のリストを取得しました。重複を見つけて、同じ単語に置き換えましたが、前後に「*」を付けました。コードは次のようになります。
def show(self, list1):
a = [x for x in list1 if list1.count(x) > 1]
lista2 = ["*"+s+"*" if s in a else s for s in list1]
print(lista2)
入力:
> ['utanför', 'dörren', 'stod', 'en', 'man', 'och', 'lyssnade', 'intensivt', 'i', 'den', 'mörka', 'korridoren', 'han', 'hade', 'skuggat', 'digby', 'groat', 'hela', 'eftermiddagen', 'och', 'följt', 'efter', 'honom', 'in', 'i', 'huset', 'när', 'han', 'fick', 'hära', 'ljudet', 'av', 'fotsteg', 'från', 'rummet', 'smög', 'han', 'sig', 'in', 'i']
出力:
> ['utanför', 'dörren', 'stod', 'en', 'man', '*och*', 'lyssnade', 'intensivt', '*i*', 'den', 'mörka', 'korridoren', '*han*', 'hade', 'skuggat', 'digby', 'groat', 'hela', 'eftermiddagen', '*och*', 'följt', 'efter', 'honom', '*in*', '*i*', 'huset', 'när', '*han*', 'fick', 'hära', 'ljudet', 'av', 'fotsteg', 'från', 'rummet', 'smög', '*han*', 'sig', '*in*', '*i*']
複製には*
前後があることに注意してください。
TL:DR 最初の重複を無視し、残りを前後に * で強調表示します。
編集:
def show(self, list1): new_list, seen = [], set() for x in list1: if x in seen: new_list.append('*{0}*'.format(x)) else: new_list.append(x) seen.add(x) print new_list
魔法のように機能するようです。追加したいのは、大文字と小文字を区別することだけです。あたかも「ハン」と「ハン」が発生したかのように、それが重複していることに気づきます。