2

Lingpipe の感情分析モジュールを使用して感情分析を実装しました。これには動的 LR モデルが使用されていることを知っています。テスト文字列が肯定的な感情か否定的な感情かを教えてくれるだけです。感情が表現されたオブジェクトを決定するために、どのようなアイデアを使用できますか?

テキストが肯定的な感情として分類されている場合、感情が表現されているオブジェクトを取得したいと思います。これは、映画の名前、製品名などです。

4

2 に答える 2

4

この質問は本当に古いですが、他の人の利益のために答えたいと思います。

ここで必要なのは、概念レベルの感情分析です。非常に基本的なバージョンの場合、次の手順に従うことをお勧めします。

  1. 文分割を適用します。Lingpipe の Sentence Splitter または OpenNLP Sentence Detector のいずれかを使用できます。

  2. 一部仕様のタグ付けを適用します。ここでも、Lingpipe の POS タガーまたは OpenNLP POS タガーのいずれかを使用できます。

  3. 次に、POS タガーによって「名詞」として識別されたトークンを識別する必要があります。これらのトークンは、文の対象となるエンティティになる可能性があります。

  4. 次に、センテンス内のセンチメント ワードを見つける必要があります。これを行う最も簡単な方法は、感情を表す単語の辞書を使用することです。そのような辞書はオンラインでたくさん見つけることができます。

  5. 次のステップは、文中の依存関係を見つけることです。これは、 Stanford Dependency Parserを使用して実現できます。たとえば、オンライン デモで「 This phone is good.」という文を試してみると、次の「Typed Dependencies」が表示されます。

    det(phone-2, This-1), nsubj(good-4, phone-2) , cop(good-4, is-3), root(ROOT-0, good-4)

    ここで、依存関係nsubj(good-4, phone-2)は、phoneがトークンgoodの名目上の主語であることを示し、単語goodがphoneに対して表現されることを意味します。あなたのセンチメント ディクショナリには、goodという単語が含まれており、電話はPOS タガーによって名詞として識別されるはずです。したがって、エンティティphoneに対してセンチメントグッドが表現されたと結論付けることができます。

これは非常に基本的な例でした。さらに一歩進んで、依存関係に関するルールを作成して、より複雑な感情とエンティティのペアを抽出できます。また、センチメント タームにスコアを割り当て、センテンス内のセンチメント ワードの出現回数に応じてセンテンスの合計スコアを計算することもできます。

于 2012-08-23T22:17:33.267 に答える
0

通常、感情文は、そのような文の主実体がその感情の対象であることを意味します。したがって、基本的なヒューリスティックは NER であり、最初のオブジェクトを取得します。それ以外の場合は、ディープ パーシング NLP ツールキットを使用し、センチメントをオブジェクトにリンクするルールを作成する必要があります。

于 2011-09-29T09:14:49.457 に答える