Stanford CoreNLPを使用した浅い解析と深い解析が必要です。私はたくさんグーグルで検索しましたが、成功しません。最後に、Constituency パーサーとDependency パーサーの2 つのパーサーがあることがわかりました。
私の質問は次のとおりです。
Constituency Parser は浅い解析であり、依存関係パーサーは深い解析ですか?
上記のパーサーと役立つリンクの両方のコードを載せることはできますか?
Stanford CoreNLPを使用した浅い解析と深い解析が必要です。私はたくさんグーグルで検索しましたが、成功しません。最後に、Constituency パーサーとDependency パーサーの2 つのパーサーがあることがわかりました。
私の質問は次のとおりです。
Constituency Parser は浅い解析であり、依存関係パーサーは深い解析ですか?
上記のパーサーと役立つリンクの両方のコードを載せることはできますか?
構成要素と依存関係の解析の違いは、深い解析と浅い解析の違いとは何の関係もありません。それらは完全に直交しています
構成要素の解析は、単語がツリーのリーフであり、非リーフ ノードが構成要素 (名詞句、動詞句、前置句など) であるが決して単語ではない従来の解析です。
依存関係の解析では、ツリー内の構成ノードは構築されません。ツリー内のすべてのノードは 1 つの文の単語です。ツリーは、単語間の階層 (実際には依存) を確立します。
コンスティチュエンシー ツリーは、すべてのルールのヘッド ノードがわかっている場合、決定的に依存関係ツリーに変換できます。依存関係ツリーには、どの構成要素を作成する必要があるかに関する情報がないため、逆方向の変換はできません。
一方、「ディープ パーシング」は文の完全なツリーを構築することを指し (つまり、パーサーに通常期待されるもの)、「シャロー パーシング」は 1 つのセンテンスの部分ツリーのセットを構築するより簡単なタスクです。 (例: 名詞句のみをグループ化)
通常、依存関係の解析では完全なツリー (つまり、深い解析) が生成され、深い解析と浅い解析の両方に対応するコンスティチュエンシー パーサーがあります。ただし、部分的な (または浅い) 分析を生成する依存関係パーサーを構築することは可能です。
https://en.wikipedia.org/wiki/Shallow_parsingで説明されているように、「浅いパーサー」とは句チャンカーを意味すると想定しています。
スタンフォード CoreNLP は浅いパーサーを提供しておらず、依存関係パーサーはそれではありません。
OpenNLPのチャンカーとFreelingが提供するチャンカーを使用しました。
どちらも私の目的のためにうまくいきました。OpenNLP を使い始めるのは簡単で、特に私のように Clojure で作業する方が簡単であることがわかりましたが、最終的に Freeling を使用することになりました。