spacy - 動詞の形に基づくスペーシーパターンの例外ケース

翻译自：https://stackoverflow.com/questions/63709822 2020-09-02T16:33:18.790

76 次

名詞の後に形容詞が続くことを認識するスペーシーパターンを作成しようとしています。これは次のとおりです。

pattern = [{'POS':'NOUN'}, {'POS':'ADJ'}]

ただし、形容詞が動詞の分詞形でない場合を例外として作成しようとしています。私の例はスペイン語なので、申し訳ありません。たとえば、「comprometida」のタグには VerbForm_part=True が含まれているため、「institución educativa」のようなものを見つけて再トークン化したいのですが、「institución comprometida」はそうではありません。

以下を追加してみましたが、'institución educativa' のような場合にのみパターンが完全に機能しなくなりました: pattern = [{'POS':'NOUN'}, {'OP':'!', 'TAG':' VerbForm_part'}, {'POS':'ADJ'}]

私も試しました: pattern = [{'POS':'NOUN'}, {'POS':'ADJ', 'TAG': not 'VerbForm_part'}]

要約すると、名詞とそれに続く形容詞をグループ化する必要がありますが、一部のタイプの形容詞のみをグループ化し、TAG 属性「VerbForm_part」に基づいて他のタイプを除外します。

Spacyでこれを行う方法はありますか? そのパターンで例外をサポートしていますか?

ありがとうございました！

spacy - 動詞の形に基づくスペーシー パターンの例外ケース

1 に答える 1

Related

Reference

spacy - 動詞の形に基づくスペーシーパターンの例外ケース