NLTK を使用してテキストから名前付きエンティティを抽出しようとしています。NLTK NER は私の目的に対してあまり正確ではないことがわかったので、独自のタグをいくつか追加したいと考えています。自分の NER をトレーニングする方法を見つけようとしていますが、適切なリソースを見つけることができないようです。NLTK についていくつか質問があります。
- 自分のデータを使用して NLTK で Named Entity Recognizer をトレーニングできますか?
- 自分のデータを使用してトレーニングできる場合、named_entity.py は変更するファイルですか?
- 入力ファイル形式は IOB である必要がありますか。エリック NNP B-PERSON ?
- nltkクックブックとPythonを使用したnlp以外に、使用できるリソースはありますか?
この点で本当に助けていただければ幸いです