私のnltkデータは~/nltk_data/corpora/words/(en,en-basic,README)
__init__.py
内部によると~/lib/python2.7/site-packages/nltk/corpus
、ブラウンコーパスの単語のリストを読むには、次を使用します
nltk.corpus.brown.words()
。
from nltk.corpus import brown
print brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
これ__init__.py
には
words = LazyCorpusLoader(
'words', WordListCorpusReader, r'(?!README|\.).*')
だから私が書くとき、ディレクトリにある
from nltk.corpus import words
「単語」機能をインポートして いますか?__init__.py
python2.7/site-packages/nltk/corpus
また、なぜこれが起こるのですか:
import nltk.corpus.words ImportError: No module named words from nltk.copus import words # WORKS FINE
「茶色の」コーパスは
~/nltk_data/corpora
(nltk/コーパスではなく) 内部にあります。では、なぜこのコマンドが機能するのでしょうか。from nltk.corpus import brown
これでいいのではないですか?
from nltk_data.corpora import brown