キーワードがポジティブに使用されたかネガティブに使用されたかをログに記録するために文を分析するための要件に対するJava駆動のソリューションを探しています。
つまり、キーワードは「キャベツ」と文である可能性があります:-
「私はキャベツは好きですが、エンドウ豆は好きではありません」
そして、私はこれをポジティブとしてログに記録するために、ある種のJavaテキストアナライザーが欲しいです。これには、lucene(Hibernate-Search)ライブラリを利用できますか?
何かご意見は?
キーワードがポジティブに使用されたかネガティブに使用されたかをログに記録するために文を分析するための要件に対するJava駆動のソリューションを探しています。
つまり、キーワードは「キャベツ」と文である可能性があります:-
「私はキャベツは好きですが、エンドウ豆は好きではありません」
そして、私はこれをポジティブとしてログに記録するために、ある種のJavaテキストアナライザーが欲しいです。これには、lucene(Hibernate-Search)ライブラリを利用できますか?
何かご意見は?
あなたは「感情分析」を探しています。1つの可能性は、競合他社にも親切にリンクしているLingPipeです。Jeff Daltonのブログには、自然言語処理ツールのすばらしいリストもあります。
私はそのようなものがあるとは思わない。Luceneは、箱から出してすぐにそれを行うことはできません。
プログラムで評価できる方法で、「キーワードがポジティブに使用されたかネガティブに使用されたか」をどのように定義しますか?それを適切に行うには、テキストの実際の意味を分析する必要があります。これは、リモートでも解決されないAIの問題です。
キーワードがポジティブ(良い、素晴らしい、素晴らしい)またはネガティブ(悪い、嫌い、くだらない、いまいましい)キーワードに近いことが多いかどうかの統計分析を行うだけで、おおよそそれを解決できると思いますが、それでも否定です、皮肉や複雑な文の構造には問題があります。
Luceneに基づいて構築されているが、箱から出して必要なものをたくさん追加するMahoutTasteを見てください。(編集)付け加えておきますが、Mahout Tasteは単にあなたが探しているものに関連しており、100%一致するものではありません。