これは、LingPipe 機械学習ツールを使用してセンチメント分析を行うコンテキストです。大きな段落の文に肯定的/否定的な感情があるかどうかを分類する必要があります。私はLingPipeで次のアプローチを知っています
極性に基づいて段落全体を分類する - 負か正か。
ここで、文章レベルでの極性はまだわかりません。まだ段落レベルです。段落内の文が肯定的/否定的な文であるかどうかの、段落の文レベルでの極性を判断するにはどうすればよいですか? LingPipe は文が主観的か客観的かを分類できることを知っています。したがって、このアプローチを使用すると、、、、
、、、、 するべきか
まず、主観的/客観的な大量の文で LingPipe をトレーニングします。
- トレーニング済みモデルを使用して、テスト パラグラフからすべての主観的な文を抽出します。
- ポジティブ/ネガティブとして手動でラベル付けすることにより、極性について抽出された主観的な文に基づいて LingPipe 分類子をトレーニングします。
訓練された極性モデルを使用して、テストの主観的な文 (訓練された主観的/客観的な文を通過させることによって行われる) モデルをフィードし、ステートメントが肯定的か否定的かを判断しますか?
上記のアプローチは機能しますか?上記の提案されたアプローチでは、LingPipe が極性分類のために大きなテキスト コンテンツ (段落) を受け入れることができることがわかっています。極性分類に主観的な文を 1 つ渡すだけでうまくいくでしょうか? 私は混乱しています!