13

OpenNLP を使用して文の主語を取得する方法はありますか? ユーザーの文の最も重要な部分を特定しようとしています。通常、ユーザーは私たちの「エンジン」に文を送信します。私たちは、その文の中心的なトピックが何であるかを正確に知りたいと考えています。

現在、openNlp を使用して次のことを行っています。

  1. 文をチャンクする
  2. 文の名詞句、動詞などを特定する
  3. 文のす​​べての「トピック」を特定する
  4. (まだ完了していません!) 文の「コア トピック」を特定する

何か明るいアイデアがあれば教えてください..

4

2 に答える 2

17

依存関係パーサー

文の主語である単語や句などの文法的な関係を抽出することに関心がある場合は、実際には依存関係パーサーを使用する必要があります。OpenNLPは句構造解析をサポートしていますが、依存関係の解析はまだ行っていないと思います。

オープンソースソフトウェア

依存関係の解析をサポートするJavaで記述されたパッケージには、次のものがあります。

これらの中で、スタンフォードパーサーが最も正確です。ただし、MaltParserの一部の構成は、めちゃくちゃ高速になる可能性があります(Cer et al.2010 )。

于 2011-04-05T23:55:17.383 に答える
2

文法的な主題については、ツリー内の構成情報に依存する必要があります。パースが (TOP (S (NP ----) (VP ----))) のように見える場合は、NP をサブジェクトとして使用できます。常にというわけではありませんが、多くの場合、そのようになります。ただし、一部の文のみがこの構成になります。たとえば、受動的な構造など、その位置にない主題を持つ構造を容易に想像できます。

ただし、MaltParser を使用した方がよいでしょう。

于 2011-12-23T02:07:06.963 に答える