1

こんにちは、文中の単語の文脈を判断するための API に興味があります

センチメント アグリゲーター (文のセンチメントを評価しようとするスクリプト) の出現を見て以来、私はこれのより複雑なバージョンについて疑問に思っていました。基本的に、私が見たセンチメント アグリゲータは実際には非常に単純で、文に正と負の値を割り当てようとしますが、それでもコンテキストはわかりません。同様に、コンテキストを検出する機械の現在の進歩にはがっかりしています

私は、より複雑なアルゴリズムがより多くの属性を単語に割り当て、それらを他の単語と比較するだろうと考えていました

例:

The quick brown fox jumped over a lazy dog.

fox という単語はオブジェクトとして解釈されます

{
    word: fox,
    type: noun,
    relation: ...
}

たとえば、キツネが哺乳動物を指していて、「騙すのを邪魔する」という動詞ではないことがわかっている場合、これは別の言語に翻訳したり、ロボットの適切な反応を判断したりするのに役立ちます。

これに適した API またはオープン ソース プロジェクトはありますか?

4

3 に答える 3

2

NLP について深く掘り下げたことはありませんが、「品詞タガー」を使用すると、特定のコンテキストで単語が名詞なのか動詞なのかがわかります。少なくとも、これはあなたの文章でうまくいきました。http://cogcomp.cs.illinois.edu/demo/pos/?id=4

于 2013-02-24T21:04:55.713 に答える
1

高度な感情分析の場合、考えられる1つのステップは、各単語の単語の意味と単語間の依存関係を見つけることです。その情報を入手したら、できることがたくさんあります。たとえば、否定を処理したり、子育て(より広い概念)を使用して感覚を滑らかにしたりできます。また、単純な好き嫌いを超えて、対象となる意図やトピック(たとえば、暴力、違法行為など)を特定することもできます。単語の意味を適切に検出する機能は、ノイズの多くを排除します。(たとえば、「いいね」という言葉は、「他の人と同じように、私は...」の感情を伝えません。)

于 2013-02-26T00:27:51.580 に答える
0

言葉にはそれぞれ意味があり、おっしゃったように文が違うと意味が異なります。単語に意味のリストがあると仮定しましょう。単語をある言語から別の言語に翻訳するとき、その単語の意味は、そのリストのどの意味がその文で最も高い確率で予測できるか (特定の文で他の単語となる確率が高い) として予測できます。

このような状況は、機械学習の HMM によって解決できます。コーネル大学の Web サイトから、隠れマルコフ モデルとテキスト翻訳に関するブログ投稿を読むことができます。

その種の API を検討する必要があります。スタンフォード大学には Java NLP API があり、こちらを参照してください: http://dbpubs.stanford.edu:8091/~klein/javadoc/edu/stanford/nlp/ie/hmm/package-tree.html

于 2013-02-25T21:34:15.370 に答える