ツイッターのセンチメント分析のプロジェクトをやっていますが、考えていることがいくつかあります。
ツイートは非常に短い (140 文字未満) ため、どのテキスト分析手法が最も適していますか。例えば。ステミングは長い記事と同じように機能しますか?
nグラムはどうですか?ツイートの短さは彼らにとって最高か最悪か?
k-nearest は、品詞のタグ付けよりも正確でしょうか?
私のカスタム twitter データセットは、時間の経過とともに無関係または破損しますか? ツイッターとその情報は急速に変化するので、私にとっても大きな懸念事項です。
ありがとうございました。
PS: 良い Twitter センチメント データセットはありますか? 定期的に更新してくれたら最高です。