感情分析を実行しているときに、リンゴ(果物)ではなくリンゴ(iphone)を参照していることをマシンに認識させるにはどうすればよいですか?
アドバイスありがとうございます!
感情分析を実行しているときに、リンゴ(果物)ではなくリンゴ(iphone)を参照していることをマシンに認識させるにはどうすればよいですか?
アドバイスありがとうございます!
さて、いくつかの方法があります、
私は大文字をチェックすることから始めます、通常、名前を参照するとき、最初の文字は大文字になります。
感情分析を行う前に、品詞と固有表現抽出を使用して、関連する単語にタグを付けます。
Stanford CoreNLPは、最初から優れたテキスト分析プロジェクトであり、基本的な概念を説明します。
CoreNLPの例:
タグがどのように役立つかがわかります。
そして、より多くの情報をチェックしてください
Ofirisが説明しているように、NERは問題を解決する唯一の方法です。単語の埋め込みを使用して単語を表現する方が効果的だと思います。このようにして、マシンは単語のコンテキストを自動的に認識します。例として、「Apple」は主に「eat」と一緒になりますが、指定された入力「Apple」が「mobile」またはそのドメイン内の他の単語とともに存在する場合、Machineは「applefruit」ではなく「iPhoneapple」であると理解します。 "。word2vecやfasttextなど、単語の埋め込みを生成する一般的な方法は2つあります。Gensimは、word2vecとfasttextの両方に対してより信頼性の高い実装を提供します。
https://radimrehurek.com/gensim/models/word2vec.html https://radimrehurek.com/gensim/models/fasttext.html
日付、有名なブランド、vip、または歴史上の人物が存在する場合は、NER(固有表現抽出)アルゴリズムを使用できます。このような場合、Ofirisが提案しているように、StanfordCoreNLPは優れた固有表現抽出機能を提供します。
多義語(つまり、「良い」などの複数の意味を持つ単語)のより一般的な曖昧性解消には、語義曖昧性解消(WSD)アルゴリズムと組み合わせたPOSタガーを使用できます。後者の例はここにありますが、この目的のために無料でダウンロードできるライブラリはありません。
この問題は、多くのオープンソースの事前トレーニング済みNERモデルによってすでに解決されています。とにかく、この問題を解決するために、既存のNERモデルを再トレーニングして微調整することができます。SpacyNERによって行われたNER結果のデモはここにあります。