121

Constituencyパーサー依存関係パーサーの違いは何ですか?2つの異なる使用法は何ですか?

4

1 に答える 1

198

Constituency解析ツリーは、テキストをサブフレーズに分割します。ツリーの非終端記号はフレーズのタイプであり、終端記号は文の単語であり、エッジにはラベルが付いていません。「JohnseesBill」という簡単な文の場合、構成要素の解析は次のようになります。

                  Sentence
                     |
       +-------------+------------+
       |                          |
  Noun Phrase                Verb Phrase
       |                          |
     John                 +-------+--------+
                          |                |
                        Verb          Noun Phrase
                          |                |
                        sees              Bill

依存関係解析は、単語の関係に従って単語を接続します。ツリーの各頂点は単語を表し、子ノードは親に依存する単語であり、エッジは関係によってラベル付けされます。「JohnseesBill」の依存関係解析は、次のようになります。

              sees
                |
        +--------------+
subject |              | object
        |              |
      John            Bill

目標に最も近いパーサータイプを使用する必要があります。文中のサブフレーズに興味がある場合は、おそらく構成要素を解析する必要があります。単語間の依存関係に関心がある場合は、おそらく依存関係を解析する必要があります。

スタンフォードパーサーはどちらかを提供できます(オンラインデモ)。実際、実際に機能する方法は、常にConstituencyパーサーを使用して文を解析し、必要に応じて、Constituency解析ツリーに対して決定論的(ルールベース)変換を実行して、依存関係ツリーに変換することです。

詳細はこちらをご覧ください:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar

于 2012-05-01T17:12:30.200 に答える