1

これは、LingPipe 機械学習ツールを使用してセンチメント分析を行うコンテキストです。大きな段落の文に肯定的/否定的な感情があるかどうかを分類する必要があります。私はLingPipeで次のアプローチを知っています

  1. 極性に基づいて段落全体を分類する - 負か正か。

    ここで、文章レベルでの極性はまだわかりません。まだ段落レベルです。段落内の文が肯定的/否定的な文であるかどうかの、段落の文レベルでの極性を判断するにはどうすればよいですか? LingPipe は文が主観的か客観的かを分類できることを知っています。したがって、このアプローチを使用すると、、、、

    、、、、 するべきか

  2. まず、主観的/客観的な大量の文で LingPipe をトレーニングします。

  3. トレーニング済みモデルを使用して、テスト パラグラフからすべての主観的な文を抽出します。
  4. ポジティブ/ネガティブとして手動でラベル付けすることにより、極性について抽出された主観的な文に基づいて LingPipe 分類子をトレーニングします。
  5. 訓練された極性モデルを使用して、テストの主観的な文 (訓練された主観的/客観的な文を通過させることによって行われる) モデルをフィードし、ステートメントが肯定的か否定的かを判断しますか?

    上記のアプローチは機能しますか?上記の提案されたアプローチでは、LingPipe が極性分類のために大きなテキスト コンテンツ (段落) を受け入れることができることがわかっています。極性分類に主観的な文を 1 つ渡すだけでうまくいくでしょうか? 私は混乱しています!

4

2 に答える 2

2

文献でマルチレベル分析アプローチを調べたいと思うかもしれません。

Li、S.、他。(2010)。「ドキュメント感情分析のための複合マルチレベル モデルの活用」、2010 年パターン認識に関する国際会議。

Yessenalina、A.、他。(2010)。「ドキュメント レベルの感情分類のためのマルチレベル構造モデル」、自然言語処理における経験的手法に関する 2010 年会議の議事録、ページ 1046–1056、MIT、マサチューセッツ州、米国、2010 年 10 月 9 ~ 11 日。

マルチレベル分析アプローチは、ベクトル空間類似性検索のコンテンツ インデックス作成のように、情報検索では非常に一般的です。

Ling Pipe などの環境は、開始するのに適した方法ですが、最終的には、yura が提案するような、より低レベルで粒度の細かいツールを使用する必要があります。

于 2011-09-25T01:12:08.537 に答える
1

lingpipe を含むほとんどの機械学習ライブラリは行ベース (平面フィーチャを持つオブジェクト) です。したがって、階層的な分類を行いたい場合は、データを非正規化する必要があります。たとえば、同じ機能セットでパラグラフと文の機能を持つことができます。単語のみの分類を使用する場合は、PARRGRAPH_WORDX=true、SENTENCE_WORDX=true などの機能を作成できます。他のいくつかのツールキットでは、非正規化なしでモデルを表現できます。これはいわゆるグラフィカル モデルの例で、CRF、ACRF、マルコフ モデルなど、mallet や Factory で見つけることができるものの実装です。

于 2011-09-22T15:46:50.450 に答える