ファイルに項目を持たなくてもコーパスを作成する方法はありますか? たとえば、Web から取得したツイートや段落を操作したいとします。次のようなことができますか
myCorpus = MyCorpus([
('id', 'item', 'category'),
('id', 'item', 'category'),
('id', 'item', 'category'),
... ])
または
myCorpus.add('id', 'item', 'category')
目的は、既存の NLTK 機能を使用してコーパスを操作することです。確認TextCollection
しましたが、カテゴリを扱っていないようです。