0

私はNLTKとPythonが初めてです。独自のファイルを nltk コーパスに追加またはアップロードするにはどうすればよいですか? たとえば、自分の .TXT ファイルを ieer corpus にアップロードするにはどうすればよいですか? 出来ますか?ありがとう。

4

1 に答える 1

1

おそらくあなたがしようとしているのは、nltk ソフトウェアを使用して独自のファイルを読み取ることです。ieer 形式のファイルを含むディレクトリがある場合は、次の/home/me/corpusdirコマンドで開くことができるはずです。

myreader = nltk.corpus.reader.ieer.IEERCorpusReader(r'/home/me/corpusdir', '*.txt')

その後、実際の ieer コーパスと同じメソッドを呼び出すことができます。CorpusReader詳細については、ieerモジュール (私は一度も使用したことがありません)のドキュメントとドキュメントを確認してください。

ファイルを既存のコーパスに本当に追加したい場合は、ファイルをディレクトリにドロップするかnltk_data、(より複雑ですが、長期的にはより良い) コーパス ディレクトリから nltk ieer ディレクトリへのシンボリック リンクを配置する必要があります。元の ieer ファイルをコーパスのサブディレクトリとして扱います。

于 2012-07-13T10:05:41.613 に答える