4

私はすでにしばらくの間 NLTK で遊んでおり、特別なチャンク用のカスタム パーサー文法を定義する段階に来ています。http://nltk.googlecode.com/svn/trunk/doc/book/ch07.htmlの説明に従っていますが、この章で説明されていることとは少し異なります。たとえば、例 7.10 では、代わりに次の動詞フェーズを使用しています。次のようなもの: VP: {go<NP|PP|CLAUSE>+$}

つまり、単語の PoS タグではなく実際の単語と一致させ、正規表現で実際の単語と PoS タグを組み合わせて一致させたいと考えています。

これは可能ですか?

4

1 に答える 1

1

nltk pos-tagger によって生成された標準の PoS タグではありません。

さまざまな動詞の文法を実行する必要がある場合、タグを前処理し、すべての動詞のタグにトークンを追加するのが便利なハックかもしれません。したがって、VP: {+$} のような正規表現文字列を使用できます。

于 2013-09-04T17:26:30.753 に答える