Java用のシンプルだが「十分な」名前付きエンティティ認識ライブラリ(および辞書)を探しています。電子メールとドキュメントを処理し、名前、場所、住所、日付などの「基本情報」を抽出しようとしています。
私は周りを見回してきましたが、ほとんどは重い側にあり、完全な NLP のようなプロジェクトのようです。
推奨事項はありますか?
Java用のシンプルだが「十分な」名前付きエンティティ認識ライブラリ(および辞書)を探しています。電子メールとドキュメントを処理し、名前、場所、住所、日付などの「基本情報」を抽出しようとしています。
私は周りを見回してきましたが、ほとんどは重い側にあり、完全な NLP のようなプロジェクトのようです。
推奨事項はありますか?
同様の問題に対する私の以前の回答の1つを見たいと思うかもしれません。
それ以外では、軽量の NER システムのほとんどは、使用するドメインに大きく依存しています。たとえば、生物医学の NER システムに関するツールや論文はたくさんあります。以前の投稿 (NER を実行したい場合の主な推奨事項は既に記載されています) に加えて、検討したいツールがいくつかあります。
もう 1 つ注意してください。入力のトークン化なしでは逃げられません。自然言語のトークン化は少し複雑です。そのため、両方を行うツールボックスを使用することをお勧めします。
ところで、私は最近、私が探していた機能を備えていると思われるOpenCalaisに出くわしました。
Alchemy APIも試してみてください。オープンカレーに似ています。