私たちは最近のプロジェクトで NLTK ライブラリを使用しており、主に名前付きエンティティの部分に関心があります。
一般に、NEChunkParser クラスを使用すると、良い結果が得られます。ただし、パーサーに独自の用語を提供する方法を見つけようとしていますが、成功していません。
たとえば、私の名前 (Shay) がいくつかの場所に表示されるテスト ドキュメントがあります。ライブラリは私を GPE として見つけますが、私は PERSON として見つけてもらいたいのです...
パーサーが名前付きエンティティを必要に応じて解釈できるように、ある種のカスタム ファイル/コードを提供する方法はありますか?
ありがとう!