python - 文からの前置詞句の抽出

Question

NLTK を使用して、文から前置詞句を抽出しようとしています。これを自動的に行う方法はありますか (たとえば、関数に文を入力して前置詞句を取得するなど)?

ここでの例では、構文木を取得する前に文法から始める必要があるようです。自動的に文法を取得し、それを使用して解析ツリーを取得できますか?

もちろん、文にタグを付けて、前置詞とそれに続く名詞を選択することもできますが、前置補語が複合語の場合、これは複雑です。

score 2 · Accepted Answer

本当にやりたいことは、堅牢な統計パーサー (たとえば、スタンフォードなど) を使用して文を完全に解析し、PP でマークされた構成要素を探すことです。

(ROOT
  (S
    (NP (NNP John))
    (VP (VBZ lives)
      (PP (IN in)
        (NP (DT a) (NN house)))
      (PP (IN by)
        (NP (DT the) (NN sea))))))

NLTK の解析能力と、この機能が存在する場合の解析の精度についてはわかりませんが、Python から外部パーサーを呼び出して出力を処理することはそれほど問題ではありません。パーサーを使用すると、多くの時間と労力を節約でき (パーサーがすべてを処理するため)、この作業を行う唯一の信頼できる方法です。

python - 文からの前置詞句の抽出

2 に答える 2

Related

Reference