(Python を使用して) コーパスで最も使用されている 10 の単語を見つけるために次の定義を使用した後、コーパスのさまざまなサブカテゴリでこれらの 10 の単語のコンテキストを比較する必要があります。
def meest_freq(mycorpus):
import string
woorden = mycorpus.words()
zonderhoofdletters = [word.lower() for word in woorden]
filtered = [word for word in zonderhoofdletters if word not in stopList]
no_punct = [s.translate(None, string.punctuation) for s in filtered]
word_counter = {}
D = defaultdict(int)
for word in no_punct:
D[word] +=1
popular_words = sorted(D, key = D.get, reverse = True)
woord1 = popular_words[1]
woord2 = popular_words[2]
woord3 = popular_words[3]
woord4 = popular_words[4]
woord5 = popular_words[5]
woord6 = popular_words[6]
woord7 = popular_words[7]
woord8 = popular_words[8]
woord9 = popular_words[9]
woord10 = popular_words[10]
print "De 10 meest frequente woorden zijn: ", woord1, ",", woord2, ',', woord3, ',', woord4, ',', woord5, ',', woord6, ',', woord7, ',', woord8, ',', woord9, "en", woord10
return popular_words
そのために次のコードを使用したかったのです。
def context(cat):
words = popular_words[:10]
context = words.concordance()
print context
残念ながら、私は "AttributeError: 'str' object has no attribute 'concordance'' を取得し続けます 2 番目の定義でコードの最初のブロックの結果を使用できない理由を誰か知っていますか? return-statement を使用して、そうすべきだと思いました働くことができる。