私はこのプロジェクトに取り組んでおり、最近のツイートから Twitter ユーザーの一般的な気分を分類したいと考えています。ツイートは多種多様なドメインに属する可能性があるため、どのように対処すればよいですか?
Naive Bayes アルゴリズムを使用することもできますが ( http://phpir.com/bayesian-opinion-miningなど)、ツイートはさまざまなドメインに属する可能性があるため、これが非常に正確かどうかはわかりません。
もう 1 つのオプションは、SentiWordNetやhereなどのセンチメント ディクショナリを使用することです。これはより良いアプローチでしょうか、私にはわかりません。
また、単純ベイズまたはその他のアルゴリズムを使用する予定がある場合、分類器をトレーニングするためのデータはどこで入手できますか?
ここに追加するだけで、私は主に PHP でコーディングしています。