私はNLTKとPythonが初めてです。独自のファイルを nltk コーパスに追加またはアップロードするにはどうすればよいですか? たとえば、自分の .TXT ファイルを ieer corpus にアップロードするにはどうすればよいですか? 出来ますか?ありがとう。
質問する
866 次
1 に答える
1
おそらくあなたがしようとしているのは、nltk ソフトウェアを使用して独自のファイルを読み取ることです。ieer 形式のファイルを含むディレクトリがある場合は、次の/home/me/corpusdir
コマンドで開くことができるはずです。
myreader = nltk.corpus.reader.ieer.IEERCorpusReader(r'/home/me/corpusdir', '*.txt')
その後、実際の ieer コーパスと同じメソッドを呼び出すことができます。CorpusReader
詳細については、ieer
モジュール (私は一度も使用したことがありません)のドキュメントとドキュメントを確認してください。
ファイルを既存のコーパスに本当に追加したい場合は、ファイルをディレクトリにドロップするかnltk_data
、(より複雑ですが、長期的にはより良い) コーパス ディレクトリから nltk ieer ディレクトリへのシンボリック リンクを配置する必要があります。元の ieer ファイルをコーパスのサブディレクトリとして扱います。
于 2012-07-13T10:05:41.613 に答える