テキストからの新しいエンティティの発見に取り組んでいますが、スタンフォード nlp をこの目的に使用できるかどうか疑問に思っていましたか? 実際に私が知っていることは、スタンフォードはエンティティを認識するために訓練された分類子を必要とするということですが、私が間違っていなければ、たとえばモデルに「スタンフォードは良い大学です」が含まれていて、スタンフォードがすでに既知のエンティティである場合にのみ、既知のエンティティのみを検出します。 「fooは良い大学です」と試してみてください。新しいエンティティとして認識されません
2 に答える
0
OK - JavaScript で問題ない場合 (node.js/browser) を参照してください: http://github.com/redaktor/nlp_compromise/
これは「トレーニングなし」のソリューションです。ここ数日、特に NER (固有表現抽出) に取り組んでいました - ここで説明しました 小さなデータセット (コーパス) による固有表現認識
新しいメソッドを文書化していないため、githubの問題でお気軽にお問い合わせください(時間がなく、まだ作業中です)
于 2015-08-07T13:37:13.170 に答える