text-mining - OpenNLPで正確なエンティティ抽出のための「コンテキスト分析」を行うことはできますか?

翻译自：https://stackoverflow.com/questions/19638144 2013-10-28T14:58:57.747

1243 次

namefinder APIを使用するときに、opennlpを使用して非常に特定のコンテキストを抽出できるかどうか疑問に思っています。

たとえば、次の 2 つの文があるとします。

26 歳のジェーンスミスは、地元のセインズベリーズでビスケットを盗んだとして拘留されました。

26 歳のジェーンスミスは、勇気ある名誉勲章を授与されました。

この状況では、opennlp に文の構造 (両方の文でジェーンスミスを見つける) だけでなく、「監護」、「盗み」という単語が同じ文で使用されている場合、異なる結果が得られると結論付けたいと思います。 2 番目の文のコンテキスト。したがって、最初の文を「[START:offender] Jane Smith [END]」、2 番目の「[START:hero] Jane Smith [END]」になるようにトレーニングすると、ある時点で、文私は訓練します。

Opennlp が特徴抽出を使用していることは知っています (私が読んだものから、文の構造を調べます - ここで間違っている可能性がありますか?)。最終的に良いコンテキスト分割を取得しますか?

そうでない場合は、今後の方法を提案できますか (スケーラブルです)。ライセンスの関係で Opennlp を使い続けたいと思っています。

text-mining - OpenNLPで正確なエンティティ抽出のための「コンテキスト分析」を行うことはできますか?

0 に答える 0

Related

Reference