1

アフリカーンス語のプレーン テキスト文を含むテキスト ファイルがあります。このテキスト ファイルで nltk コーパス関数を実行できるようにしたいのですが、これを実行する方法の例が見つかりません。

次のようなことをしたいと思います。

mytext.concordance("woord")
mytext.similar("woord")

誰でも私を助けることができますか?

4

1 に答える 1

1

何かを理解することができました:

# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")

これは、コーパス テキスト ファイルが C:\nltk_data\corpora\afrikaans\afrikaans.txt にあることを前提としています。

于 2013-01-10T21:10:25.020 に答える