FreqDist を使用して、コーパスに表示される単語の出現回数を非常に高速に取得しています。問題は、いくつかの基本的な操作を行う必要がある整数としてftableが回答を返さないことです。
words = brown.words()
content = [w for w in words if w.lower()]
ftable = nltk.FreqDist(content)
例えば:
percent = ftable[sing]/ftable[s])*100
ftable.N[sing] などを試してみましたが、うまくいきません。
ありがとう!
編集:コメントでも。w.lower() は、コーパス内の単語を小文字にすることで、それらに対して for ループを実行すると、ftable が文字列と正確に一致するため、小文字の値のみを比較します。as Hello != hello カウンターを使用する場合、それは同じくらい速いですか? 検索されるコーパス/単語リストの大文字と小文字を下げる簡単な方法はありますか?