アフリカーンス語のプレーン テキスト文を含むテキスト ファイルがあります。このテキスト ファイルで nltk コーパス関数を実行できるようにしたいのですが、これを実行する方法の例が見つかりません。
次のようなことをしたいと思います。
mytext.concordance("woord")
mytext.similar("woord")
誰でも私を助けることができますか?
何かを理解することができました:
# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")
これは、コーパス テキスト ファイルが C:\nltk_data\corpora\afrikaans\afrikaans.txt にあることを前提としています。