python - nltkコーパスとしてアフリカーンス語の単語を含むテキストファイルにアクセスする方法

Question

アフリカーンス語のプレーンテキスト文を含むテキストファイルがあります。このテキストファイルで nltk コーパス関数を実行できるようにしたいのですが、これを実行する方法の例が見つかりません。

次のようなことをしたいと思います。

mytext.concordance("woord")
mytext.similar("woord")

誰でも私を助けることができますか？

score 1 · Accepted Answer

何かを理解することができました：

# How to load a text file as a corpus.
import nltk
from nltk.corpus import PlaintextCorpusReader
from nltk.corpus.util import LazyCorpusLoader
afrikaans = LazyCorpusLoader('afrikaans', PlaintextCorpusReader, r'(?!\.).*\.txt')
afrikaans.sents()[1]
af = nltk.Text(afrikaans.words())
af.concordance("mense")

これは、コーパステキストファイルが C:\nltk_data\corpora\afrikaans\afrikaans.txt にあることを前提としています。

python - nltkコーパスとしてアフリカーンス語の単語を含むテキストファイルにアクセスする方法

1 に答える 1

Related

Reference