3

ファイルに項目を持たなくてもコーパスを作成する方法はありますか? たとえば、Web から取得したツイートや段落を操作したいとします。次のようなことができますか

myCorpus = MyCorpus([
    ('id', 'item', 'category'), 
    ('id', 'item', 'category'),
    ('id', 'item', 'category'), 
    ... ])

または

myCorpus.add('id', 'item', 'category')

目的は、既存の NLTK 機能を使用してコーパスを操作することです。確認TextCollectionしましたが、カテゴリを扱っていないようです。

4

1 に答える 1

-1

文字列を 1 つまたは複数のファイルに書き出してから、コーパスとして処理しないのはなぜですか?

于 2010-12-29T18:33:56.760 に答える