ある単語リストの出現箇所を別の単語リストで見つけようとしています。私のコードは次のようになります。
for cat, text2 in posts:
words=wordpunct_tokenize(text2)
for word in words:
if word in top:
counter[word]+=1
print counter
単語は次のようになります: [("Post1", "post1" ,"post1"), ("post2","post2), ("post3")]
top は次のよう"Post1, Post2, Post3"
になります 期待される結果は次のようになります。
{post1: 3}
{post2, 2}
{post3, 1}
ただし、現在得られる出力は次のとおりです。
{'post1': 3})
{'post2': 2, 'post1': 3})
{'post3': 1, 'post2': 2, 'post1': 3})
プログラムが前の行の単語を次の行に追加しているように見えますが、これを修正する方法を知っている人はいますか?