オブジェクトを使用しcollections.defaultdict
て ID を収集し、enumerate()
それらを生成します。
from collections import defaultdict
output = defaultdict(list)
for index, sentence in enumerate(inputlist):
for word in sentence.lower().split():
output[word.strip('!?. ')].append(index)
文を小文字にし、残りの句読点を取り除くことに注意してください。
結果:
defaultdict(<class 'list'>, {'are': [0, 1], 'they': [0], 'be': [2], 'who': [0], 'yes': [2], 'there': [1, 2], 'you': [1, 2]})
これは 0 から始まるインデックスを使用します (Python のすべてのものと同様)。1 から数える必要がある場合はenumerate()
、そこから数えるように指示します。
for index, sentence in enumerate(inputlist, 1):