TextBlob が提供するすぐに使える分類器の大部分を使用したいのですが、独自の小さなトレーニング データ セットも追加したいと考えていました。これは、分析しているテキストに、トレーニング セットに確実に入れたいニッチな単語が含まれているためです。
したがって、TextBlob では、このように既存の分類子を拡張できると言われています。
>>> new_data = [('She is my best friend.', 'pos'),
("I'm happy to have a new friend.", 'pos'),
("Stay thirsty, my friend.", 'pos'),
("He ain't from around here.", 'neg')]
>>> cl.update(new_data)
True
>>> cl.accuracy(test)
1.0
ただし、このデータをデフォルトの分類器に追加することについては何も述べていません。これが可能かどうか誰にもわかりますか?
編集
または、逆に分類器をトレーニングできるように、十分なトレーニング データを取得できる場所はありますか?