名詞の後に形容詞が続くことを認識するスペーシー パターンを作成しようとしています。これは次のとおりです。
pattern = [{'POS':'NOUN'}, {'POS':'ADJ'}]
ただし、形容詞が動詞の分詞形でない場合を例外として作成しようとしています。私の例はスペイン語なので、申し訳ありません。たとえば、「comprometida」のタグには VerbForm_part=True が含まれているため、「institución educativa」のようなものを見つけて再トークン化したいのですが、「institución comprometida」はそうではありません。
以下を追加してみましたが、'institución educativa' のような場合にのみパターンが完全に機能しなくなりました: pattern = [{'POS':'NOUN'}, {'OP':'!', 'TAG':' VerbForm_part'}, {'POS':'ADJ'}]
私も試しました: pattern = [{'POS':'NOUN'}, {'POS':'ADJ', 'TAG': not 'VerbForm_part'}]
要約すると、名詞とそれに続く形容詞をグループ化する必要がありますが、一部のタイプの形容詞のみをグループ化し、TAG 属性「VerbForm_part」に基づいて他のタイプを除外します。
Spacyでこれを行う方法はありますか? そのパターンで例外をサポートしていますか?
ありがとうございました!