-2

ツイート文字列を特定のカテゴリに分類する分類器を作成する必要があります。私は約15かそこらのカテゴリを持っています。トレーニング データセットを持っています。どうすればこれを進めることができますか?これには Python または Java を使用します。

私は Textblob と Stanford NLP 分類器を調べてきました。より良い結果を得るためにどちらを選択すればよいかわかりません。

4

1 に答える 1

1

Python での教師あり機械学習に scikit-learn を使用することを楽しんでいます。http://scikit-learn.org/stable/ .

Java については、さまざまな NLP タスクに既存のツールキットを活用しているため、 DKPro https://dkpro.github.io/を調べることができます。

最後に、使用するツールキットが何であれ、TweetNLP http://www.ark.cs.cmu.edu/TweetNLP/を POS タグ付けコンポーネントに使用できるかどうかを調べることができます。

幸運を!

于 2015-10-05T16:42:59.993 に答える